Dlaczego pliki PDF generowane przez Microsoft Word są tak duże?
Gdy twoje dokumenty mają głównie charakter tekstowy, wydaje się, że rozmiary plików .docx i .pdf powinny być dość podobne po zapisaniu, ale nie zawsze tak jest. Dzisiejszy post z pytaniami i odpowiedziami dla SuperUser zawiera odpowiedzi na ciekawy pytania czytelnika dotyczące dużej różnicy w rozmiarach plików.
Dzisiejsza sesja pytań i odpowiedzi przychodzi do nas dzięki uprzejmości SuperUser - poddziału Stack Exchange, opartego na społecznościach grupowania witryn z pytaniami i odpowiedziami.
Rękawice do boksu dzięki uprzejmości Clker.com.
Pytanie
Czytnik SuperUser Borek chce wiedzieć, dlaczego pliki PDF generowane przez Microsoft Word są tak duże:
Stworzyłem prosty dokument Microsoft Word zawierający tylko to zdanie, nic więcej:
- To jest mały dokument.
Następnie zapisałem dokument jako pliki .docx i .pdf. Oto rozmiary plików:
- .docx: 12 kB
- .pdf: 89 kB
Różnica między tymi dwoma plikami jest ogromna (technicznie) i naprawdę przeszkadza mi to, że dokumenty, które w większości mają charakter tekstowy, to tylko dziesiątki KB w formacie .docx, ale mają setki rozmiarów kB po przekonwertowaniu na pliki PDF. Co jest tak nieefektywnego w formacie PDF? Czy to tylko Microsoft Word z użyciem jakiegoś okropnego algorytmu wyjściowego?
Nawiasem mówiąc, ustawienia wyjściowe PDF w mojej instalacji Microsoft Office są ustawione tak, aby tworzyć możliwie najmniejsze pliki:
Dlaczego pliki PDF generowane przez Microsoft Word są tak duże??
Odpowiedź
SuperUser contributor rene ma dla nas odpowiedź:
Jeśli otworzysz plik PDF w Notepad ++, znajdziesz:
I ten obiekt jest tu na końcu wymieniony w instrukcji / FontFile2:
Czcionki używane przez dokument Microsoft Word są osadzane w plikach PDF, dzięki czemu są one samodzielne. Użyłem tego slajdu firmy Adobe do rozszyfrowania instrukcji PDF.
Jeśli chcesz uniemożliwić osadzanie czcionek w pliku PDF, upewnij się, że twoje dokumenty Microsoft Word korzystają z jednej z 14 standardowych krojów pisma dostępnych w przeglądarkach PDF (Źródło: Wikipedia).
- Times New Roman> Times (v3) (zwykła, kursywa, pogrubienie i pogrubiona kursywa)
- Courier New> Courier (regularny, skośny, pogrubiony i pogrubiony)
- Arial> Helvetica (v3) (w regularnym, skośnym, pogrubionym i pogrubionym skośnym)
- Symbol> Symbol
- Skrzydła> Zapf Dingbaty
Czy masz coś do dodania do wyjaśnienia? Dźwięk w komentarzach. Chcesz przeczytać więcej odpowiedzi od innych użytkowników Stack Exchange, którzy znają się na technologii? Sprawdź cały wątek dyskusji tutaj.