Baur lädt eine Feeddatei auf den “FTP-Server” hoch (zu finden unter frontend01:/home/baur/data/)
Dies sollte nicht häufiger als alle 2 Wochen geschehen (kaufmännische Entscheidung)
per Cronjob wird montags um 12:00 Uhr geprüft, ob eine neue Datei vorhanden ist
Wenn ja, wird Enrichment durchgeführt und das Ergebnis auf den “FTP-Server” hochgeladen, ansonsten geschieht nichts
(so der Plan)
Bei unplanmäßigen Enrichment-Wünschen muss das Skript picalike@dev01:/home/picalike/baur/update_process.bash ausgeführt werden
Dieser Prozess sollte ggf. auf index03 migriert werden, dazu ist aber in der aktuellen Fassung eine aktualisierte Version des Indexers nötig
Der aktuelle Algorithmus zur Störererkennung ist sehr simpel, funktioniert aber bei Bademoden-Bildern recht gut
Ein Versuch auf anderen Bilder (von Unito) führte zu sehr vielen Fehldetektionen (es wurden nicht ausschließlich Bademode-Bilder verwendet)
Alternatives Verfahren: Per Convnets auf den 4096/9206 Features Klassifikator trainiert, Ergebnisse waren gut, braucht aber noch mehr Forschung/Training, damit es auch bei anderen Kunden gut funktioniert (Unito)
Der ConvNet-Extractor+Classifier läuft in unito2mongo.py. Der Dienst hängt von theano/numpy ab und weiterhin von der V4-Maschinerie (oyster_learn, extractor, picolibs) und Dienste wie die ImageCloud.