DEVONthink: Import von Pocket-Artikeln
DEVONthink: Import von Pocket-Artikeln
Die Übernahme von neuen Artikeln, die in Pocket gemerkt wurden, ist einfach: DEVONthink liest den Feed ein, der Feed wird per Applescript in einzelne Web Archives umgewandelt und derart in DEVONthink abgespeichert. Die Skriptlogik entspricht der, die ich für den IMDB-Import verwende und dort beschrieben habe, nur ohne die Bewertungen, was in wenigen Minuten eingerichtet war. Damit habe ich folglich ein lokal durchsuchbares Archiv vorliegen, welches dank Instapaper-Durchreichung auch nur den Artikelinhalt enthält und nicht das Layout drumrum.
Das eher mäßige Ergebnis des Pocket-Feeds…

…sieht danach wie folgt aus:

Da ich das mit dem Archivieren gelesener Webseiten nur als Test durchführe habe ich mir über die Form keine großen Gedanken gemacht, was sich nun rächt. Gelesene Webseiten habe ich aus unterschiedlichen Quellen nach Evernote übernommen.
- Direkt per Evernote-Browser-Plugin
- Per IFTTT aus Pocket
- Per Feed und IFTTT aus Instapaper
- Mail mit der URL
- Mail mit dem kompletten Inhalt
Daraus ergibt sich ein ziemlich inkonsistenter Haufen an Artikeln, der normalisiert werden möchte. Recht einfach geht das bei den per Browser-Plugin gespeicherten Artikeln, da diese noch die Original-URL in den Metadaten enthalten. Ein entsprechendes Applescript ist schnell zusammen gezimmert und “verschiebt” 4.400 Artikel von Evernote nach DEVONthink, wo sie als Web Archive offline herum liegen.
Bleiben noch 1.400 Artikel übrig, von denen etwa 900 via Pocket übernommen wurden, was bedeutet, dass sie mit einem IFTTT-Template formatiert wurden und immer in der fünftletzten Zeile den Content, sowie in der drittletzten Zeile den Link enthalten. Das lässt sich einigermaßen bequem per Applescript aus Evernote entnehmen:
set currentNoteURL to missing value
set thisText to HTML content of currentNote
set TID to AppleScript's text item delimiters
set text item delimiters of AppleScript to "<br/> <br/> <a href=\""
set numLines to count text items of thisText
set numUrlLine to numLines
set thisItem to text item numUrlLine of thisText
set text item delimiters of AppleScript to "\">"
set foundUrl to text item 1 of thisItem
set text item delimiters of AppleScript to TID
if foundUrl starts with "http" then
set currentNoteURL to foundUrl
end ifplaintextDer Rest funktioniert wie schon vom IMDB-Importskript bekannt. Bleiben noch 500 Artikel unterschiedlichster Form übrig, die ich mit der Importfunktion von DEVONthink direkt übernehme.
Dank der See Also-Funktion findet DEVONthink anschließend für jeden Artikel passende Gegenstücke in der Datenbank:

Ich übernehme die Artikel dennoch zusätzlich weiterhin nach Evernote, da Evernote sich direkt in die Google-Suche integriert:
