Jak eksportować swoje elementy oznaczone gwiazdką z Czytnika Google
Jeśli Twoja reakcja na ogłoszenie o śmierci Google Reader brzmiałaby "Ale moje ulubione przedmioty!", To jest tutorial dla ciebie. Czytaj dalej, ponieważ pokazujemy różne sposoby wyodrębniania wszystkich artykułów oznaczonych gwiazdką z Czytnika Google.
Dlaczego chcę to zrobić?
Czytnik Google wyłącza się 1 lipca. Jeśli ty, podobnie jak miliony fanów RSS na całym świecie, jesteś fanem Czytnika Google, istnieje duża szansa, że użyłeś funkcji gwiazdy do oznaczania artykułów do przetrzymywania, czytania później lub do jakiegoś innego celu.
Jeśli chcesz mieć pewność, że wszystkie te artykuły oznaczone gwiazdką są bezpieczne i bezpieczne mimo zbliżającej się implozji Czytnika Google, musisz wykonać kilka drobnych czynności, aby upewnić się, że masz dane w posiadaniu i nie zostawiasz ich do zgniotu. Serwery Google.
Po zakończeniu samouczka będziesz mieć (przynajmniej) plik, który zawiera wszystkie elementy oznaczone gwiazdką oraz (w zależności od tego, z którego segmentu samouczek zdecydujesz się podążać) elementy oznaczone gwiazdką w większej liczbie użytkowników przyjazny format.
Jest jednak jedna rzecz, z której nie może skorzystać magia wywozu lub automatyzacji, a to faktycznie przetwarza treść artykułów oznaczonych gwiazdką. Jeśli publikujesz artykuły, które będą czytać później przez lata, prawdopodobnie zdziwisz się, ilu eksportowanych artykułów generuje ten proces. Być może będziesz musiał odłożyć na bok trochę czasu każdego dnia na kilka tygodni, aby przeglądać wynikowy zrzut bit po bicie.
Eksportowanie danych Google Reader z Google Takeout
Najpierw należy uzyskać kopię wszystkich danych z Czytnika Google bezpośrednio w swoim posiadaniu. W ten sposób, bez względu na to, co stanie się z Twoimi danymi z Czytnika na serwerach Google w przyszłości, będziesz mieć kopię, z którą będziesz mógł pracować.
Google Takeout to świetne narzędzie do wydobywania danych ze wszystkich usług Google, ale interesuje nas tylko Czytnik w tym samouczku. Odwiedź podsekcję Czytnik narzędzia Google Takeout tutaj. Obliczenie rozmiaru pliku Takeout zajmie chwilę. Po zakończeniu kliknij Utwórz archiwum.
Mimo że nie eksportuje całego konta Google, ale tylko niewielką jego część, proces ten zajmuje zaskakująco dużo czasu. Zalecamy sprawdzenie opcji "Wyślij do mnie e-maila, gdy będzie gotowa" i zabranie filiżanki kawy.
Kiedy wszystko się skończy, kliknij przycisk Pobierz, który pojawi się w prawym dolnym rogu.
Śmiało i wyodrębnij archiwum do katalogu roboczego, takiego jak Moje dokumenty, i umieść archiwum w bezpiecznym miejscu. Pliki archiwum są uporządkowane w następujący sposób:
[email protected].
... [email protected]
... Czytelnik
... followers.json
... follow.json
... lubi.json
... notes.json
... shared-by-followers.json
... shared.json
... starred.json
... subscriptions.xml
W archiwum są dwa typy plików: JSON i XML. Pliki JSON (JavaScript Object Notation) są po prostu typem formatu wymiany danych, a pliki XML (Extensible Markup Language) są poręcznym sposobem oznaczania dokumentu, tak aby był on zarówno czytelny dla komputera, jak i dla człowieka. Plik, który najbardziej nas interesuje w tym samouczku, to plik starred.json, ponieważ zawiera wszystkie wpisy dotyczące elementów oznaczonych gwiazdką.
Równie ważna w wielkim schemacie uwalniania danych z Czytnika Google i przechodzenia na bardziej zielone pastwiska jest jednak plik subscriptions.xml. Ten plik zawiera wszystkie subskrypcje RSS i, jeśli chcesz importować wszystkie stare subskrypcje z Czytnika Google do nowej aplikacji RSS, jest to plik, którego będziesz używał. Zdecydowanie zachowaj to (i oryginalne archiwum pobrane z Google Takeout) w bezpiecznym miejscu.
Konwertowanie elementów oznaczonych gwiazdkami na zakładki
Jednym z najprostszych sposobów radzenia sobie z plikiem JSON jest użycie JSONview (rozszerzenia dostępnego zarówno dla przeglądarki Firefox, jak i Chrome). Ta metoda najlepiej nadaje się dla czytelników z niewielką liczbą elementów oznaczonych gwiazdką w Czytniku Google (mniej niż 1000).
Zainstaluj rozszerzenie dla swojej przeglądarki, a następnie przeciągnij i upuść plik starred.json na nowe okienko przeglądarki. Zapisz wynikowy plik jako dokument HTML. Następnie możesz skręcić w prawo i zaimportować dokument HTML do wybranej przez ciebie przeglądarki internetowej, która zaimportuje wszystkie linki jako nowe zakładki.
Istnieją jednak dwa wady tej techniki. Po pierwsze, w pliku zakładek pojawią się zduplikowane adresy URL, ponieważ adres URL głównej domeny / głównego artykułów często oznaczonych gwiazdką (np. Powiedz, artykuły z How-To Geek) pojawi się wiele razy. To trochę denerwujące, ale nie takie duże.
Drugą wadą jest łamacz transakcji dla osób, które mają dużo przedmiotów oznaczonych gwiazdką (tych z nami z tysiącami pozycji oznaczonych gwiazdką); gdy mamy do czynienia z naprawdę ogromnym importem HTML, w większości przypadków po prostu się psuje i nigdy się nie kończy. Oczywiście jest to wysoce niezadowalające rozwiązanie dla zaawansowanych użytkowników programu Reader, ponieważ nigdy nie kończy importowania elementów oznaczonych gwiazdką. Jeśli jesteś zaawansowanym użytkownikiem i masz do dyspozycji tysiące przedmiotów z gwiazdkami, zaimportowanie ich jako zakładki po prostu tego nie zmieni..
Konwertowanie elementów oznaczonych gwiazdką na pojedyncze linki (i importowanie do Evernote)
Aby uzyskać moc przetwarzania wymaganą przez użytkowników (rodzaj przetwarzania, dzięki któremu w ciągu kilku minut można przetworzyć ponad 5000 elementów oznaczonych gwiazdką), zwracamy się do Pythona, aby pomóc nam przełamać naszą ogromną listę.
Dzięki uprzejmości Paula Kerchena i Davide Della Casa, dwóch potężnych użytkowników Google Reader, którzy chcieli wyeksportować wszystkie swoje stare pozycje oznaczone gwiazdką, mamy dwa bardzo przydatne skrypty w języku Python, które mogą nam pomóc w jednej z dwóch rzeczy: 1) przekonwertować wszystkie pozycje oznaczone gwiazdką na różne dokumenty HTML i / lub 2) importować wszystkie nasze oznaczane gwiazdkami elementy do Evernote.
Obie sztuczki wymagają zainstalowania w systemie Pythona. Chwyć kopię Pythona dla swojego systemu operacyjnego i zainstaluj go przed kontynuowaniem.
Po zainstalowaniu Pythona odwiedź stronę projektu eksportu Czytnika Google Kerchen / Casa i zapisz pliki export2HTMLFiles.py i export2enex.py do tego samego folderu, do którego wyodrębniono plik starred.json.
Jeśli chcesz przekonwertować wszystkie elementy oznaczone gwiazdką na odrębne pliki HTML, możesz to zrobić za pomocą pliku export2HTMLFiles.py, wykonując następujące polecenie w katalogu, w którym przechowywany jest plik starred.json:
python export2HTMLFiles.py
(Jeśli python nie jest oznaczony jako ogólnosystemowe polecenie na twoim komputerze, zastąp "python" pełną ścieżką do pliku wykonywalnego Pythona, np. C: \ Python2.7 \ python.exe)
W zależności od liczby elementów oznaczonych gwiazdką proces ten może trwać od kilku sekund do kilku minut. Potrwało to około trzech minut, aby przebić 12 000 oznaczonych gwiazdkami przedmiotów podczas naszego testu.
Gdy to się stanie, będziesz mieć serię ponumerowanych i nazwanych plików HTML (np. 1 artykuł, w którym zaznaczyłeś gwiazdkę.html do 10000 jakiegoś innego artykułu, w którym zaznaczyłeś gwiazdkę.html). Najprostszym sposobem na obejrzenie ich wszystkich jest po prostu załadowanie lokalnego katalogu w przeglądarce.
To świetny sposób na uwolnienie elementów oznaczonych gwiazdką z Czytnika Google i pliku JSON, ale jak wspomnieliśmy wcześniej w samouczku, jeśli zapisywałeś artykuły i czytasz je później przez lata, będziesz miał monumentalne zadanie Twoje ręce.
Jednym ze sposobów lepszego zarządzania tym zadaniem jest wykorzystanie Evernote jako obszaru roboczego do sortowania, tagowania i potencjalnego usuwania nieużytecznych elementów oznaczonych gwiazdką..
Istnieją dwa sposoby importowania elementów do Evernote. Możesz zaimportować pliki HTML, które stworzyliśmy przed chwilą, używając folderu importu. W twoim kliencie desktop Evernote możesz przejść do Narzędzia -> Importuj foldery, a następnie utwórz folder zrzutu dla plików HTML. Zrobiliśmy podfolder w folderze / Reader / work o nazwie Imports i nowy notes w Evernote o nazwie Elementy oznaczone gwiazdką. Przeciągając i upuszczając pliki HTML do folderu / Reader / Imports /, jesteśmy w stanie zaimportować je jako odrębne notatki do folderu Elementy oznaczone gwiazdką Evernote. Są tam na stałe przechowywane i sprawdzane w czasie wolnym.
Jeśli chcesz za jednym zamachem przekonwertować wszystkie elementy oznaczone gwiazdką do natywnego notesu Evernote, możesz użyć drugiego skanu Pythona, który pobrałeś, export2enex.py, aby to zrobić. Zaletą takiego rozwiązania jest to, że ma nieco lepszą pracę, zachowując formatowanie dokumentów.
W folderze, w którym znajduje się plik starred.json, wykonaj następujące polecenie:
python export2enex.py> StarredImport.enex
Pobierz plik wynikowy StarredImport.enex i zaimportuj go do swojego klienta Evernote za pomocą opcji Plik -> Importuj -> Eksportuj pliki Evernote.
W tym momencie udało Ci się całkowicie uwolnić elementy oznaczone gwiazdką od Czytnika Google i możesz przejść do (potencjalnie długiego) biznesu sortowania stosu.
Czy masz sprytny sposób na manipulowanie plikiem JSON i wyodrębnianie elementów oznaczonych gwiazdką? Dołącz do dyskusji poniżej i podziel się z innymi czytelnikami swoimi wskazówkami i wskazówkami.