Główna » Pulpit » Jak łatwo wyodrębnić tekst i obrazy z plików MS Office

    Jak łatwo wyodrębnić tekst i obrazy z plików MS Office

    Możemy natknąć się na potrzebę wyodrębnienia obrazów lub tekstu z pliku MS Word lub MS Powerpoint. Zazwyczaj może to być ręczne kopiowanie i wklejanie, jedna strona na raz, a przy dużych plikach zajmie to sporo czasu.

    Mamy prostą sztuczkę, aby ci pomóc wyodrębniaj obrazy i tekst z plików nowego formatu tj. DOCX, PPTX, XLSX, podczas gdy z plikami starszego formatu, tj. DOC, PPT, XLS, wszystko czego potrzebujesz to darmowe oprogramowanie aby pomóc Ci szybko i łatwo wyodrębnić obrazy.

    Uwaga: W celu demonstrowania tego postu użyjemy tylko pliku MS Word. Proces jest taki sam dla plików MS Powerpoint i MS Excel.

    Oto, co obejmuje ten artykuł:

    1. Jak wyodrębnić obrazy i tekst z plików DOCX, PPTX, XLXS
    2. Jak wyodrębnić obrazy z jednego pliku DOC, PPT lub XLS
    3. Jak wyodrębnić obrazy z wielu plików DOC, PPT lub XLS
    4. Jak wyodrębnić obrazy za pomocą “Zapisz jako stronę internetową” metoda
    5. Jak wyodrębnić zwykły tekst zamiast XML

    Jak wyodrębnić obrazy i tekst z plików DOCX, PPTX, XLXS

    Przed wykonaniem kroków otwórz folder zawierający twoje pliki. Kliknij Organizuj> Opcje folderów i wyszukiwania> Wyświetl i odznacz Ukryj rozszerzenia dla znanych typów plików. Teraz możesz zobaczyć rozszerzenie pliku z każdą nazwą pliku.

    1. Znajdź i wybierz plik, z którego chcesz wyodrębnić obrazy i tekst (uwaga: lepiej zrobić kopię tego pliku). W tym przykładzie nazwany jest nasz plik docelowy Przykładowy plik.docx.

    2. naciśnij F2 aby zmienić nazwę pliku i zastąpić nazwę rozszerzenia .zamek błyskawiczny.

    3. Zostanie wyświetlone ostrzeżenie potwierdzające zmianę rozszerzenia pliku. Kliknij tak.

    4. Kliknij prawym przyciskiem myszy na pliku ZIP i kliknij Rozpakuj pliki.

    5. Zlokalizuj i otwórz folder zawierający wyodrębnione dane, a następnie otwórz słowo.

    6. W nim zobaczysz kilka folderów i plików XML. w głoska bezdźwięczna folder znajdziesz wyodrębnione obrazy. W przypadku wygasłego tekstu otwórz document.xml plik z notatnikiem lub Notatnikiem XML.

    Oto, co znajdziesz w głoska bezdźwięczna teczka.

    Jak wyodrębnić obrazy z pojedynczego pliku DOC, PPT lub XLS

    Jeśli chcesz wyodrębnić obrazy z plików MS Office za pomocą starsze formaty, powyższa metoda nie działa z obrazami. Do tego celu potrzebne jest bezpłatne narzędzie o nazwie Office Image Extraction Wizard. Narzędzie działa z plikami MS Office już w 2012 roku i działa z jednym lub wieloma plikami MS Office za jednym razem.

    1. Pobierz i zainstalować Kreator ekstrakcji obrazów Office.

    2. Wybierz dokument, z którego chcesz wyodrębnić obrazy (w tym przykładzie robimy to w folderze, którego nazwałem Ch1.doc) i wybierz folder wyjściowy. Możesz zdecydować się na utworzenie folderu do przechowywania wszystkich obrazów wyjściowych, zaznaczając tę ​​opcję Utwórz tutaj folder. Po zakończeniu kliknij Kolejny.

    3. Kliknij Początek aby rozpocząć proces.

    4. Po zakończeniu procesu ekstrakcji obrazu kliknij Kliknij tutaj, aby otworzyć folder docelowy i otworzy folder wyjściowy.

    5. Jak widać poniżej, program stworzył Ch1 teczka.

    6. Wewnątrz folderu są wyodrębnione obrazy.

    Jak wyodrębnić obrazy z wielu plików DOC, PPT lub XLS

    1. Aby wyodrębnić obrazy z wielu plików w formatach DOC, PPT lub XLS, zaznacz pole wyboru Tryb wsadowy opcja znaleziona w lewym dolnym rogu.

    2. Kliknij Dodaj pliki i wtedy Wybierz pliki, z których chcesz wyodrębnić obrazy. Trzymaj Ctrl przycisk, aby wybrać wiele plików za jednym razem. Po wybraniu plików kliknij Kolejny.

    3. Kliknij Początek.

    4. Po zakończeniu procesu zlokalizuj i otwórz folder wyjściowy. Tutaj zobaczysz dwa foldery z oryginalnymi nazwami plików. otwarty te foldery, aby zobaczyć wyodrębnione obrazy z oryginalnych plików MS Office.

    Jak wyodrębnić obrazy za pomocą metody „Zapisz jako stronę internetową”

    Jest inna metoda, która będzie działać z obydwoma nowszy i starszy Pliki MS Office.

    1. Otwórz plik DOCX lub XLSX i kliknij Plik> Zapisz jako> Komputer> Przeglądarka i zapisz plik jako Strona internetowa.

    2. Znajdź folder z nazwą pliku, w którym zapisałeś stronę internetową. Tutaj zobaczysz wszystkie obrazy wyodrębnione z pliku.

    Jak wyodrębnić Plaintext zamiast XML

    1. Otwórz plik DOCX i kliknij Plik> Zapisz jako> Komputer> Przeglądarka. Wybierz, aby zapisać plik jako Zwykły tekst (w przypadku plików XLSX zapisz go jako Tekst (rozdzielony tabulatorem)).

    2. Znajdź i otwarty plik tekstowy o nazwie, której użyto do zapisania. Ten plik tekstowy będzie zawierał tylko tekst z oryginalnego pliku bez formatowania.

    Jeśli znasz inną metodę lub narzędzie do wyodrębniania obrazów z plików MS Office, wspomnij o tym w komentarze Sekcja.