BAUR (Störer-Detektion):\\ Betroffene Rechner: dev01, frontend01\\ Ansprechpartner: Björn\\ Anmerkungen: * Die Bausteine liegen in dev01:/home/picalike/baur * Ablauf ist folgendermaßen: * Baur lädt eine Feeddatei auf den “FTP-Server” hoch (zu finden unter frontend01:/home/baur/data/) * Dies sollte nicht häufiger als alle 2 Wochen geschehen (kaufmännische Entscheidung) * per Cronjob wird montags um 12:00 Uhr geprüft, ob eine neue Datei vorhanden ist * Wenn ja, wird Enrichment durchgeführt und das Ergebnis auf den “FTP-Server” hochgeladen, ansonsten geschieht nichts * (so der Plan) * Bei unplanmäßigen Enrichment-Wünschen muss das Skript picalike@dev01:/home/picalike/baur/update_process.bash ausgeführt werden * Dieser Prozess sollte ggf. auf index03 migriert werden, dazu ist aber in der aktuellen Fassung eine aktualisierte Version des Indexers nötig * Der aktuelle Algorithmus zur Störererkennung ist sehr simpel, funktioniert aber bei Bademoden-Bildern recht gut * Ein Versuch auf anderen Bilder (von Unito) führte zu sehr vielen Fehldetektionen (es wurden nicht ausschließlich Bademode-Bilder verwendet) * Alternatives Verfahren: Per Convnets auf den 4096/9206 Features Klassifikator trainiert, Ergebnisse waren gut, braucht aber noch mehr Forschung/Training, damit es auch bei anderen Kunden gut funktioniert (Unito) ====== Komponenten ====== Der ConvNet-Extractor+Classifier läuft in unito2mongo.py. Der Dienst hängt von theano/numpy ab und weiterhin von der V4-Maschinerie (oyster_learn, extractor, picolibs) und Dienste wie die ImageCloud.