das ist noch ein Schmierzettel für Gedanken
Alles was da rein/raus kommt darf nicht Zeitkritisch sein. Wichtiger ist das die Daten redundant und bequem zugreifbar sind.
Idee:
Datenproduzenten schreiben asyncron da rein, z.B. über einen Dateipuffer
Nachts laufen Analysejobs und erzeugen Reports
Bei bedarf wandern diese Reports in einen MemCache um im Betrieb schnell abrufbar zu sein.
Zeiten immer UTC
Notizzettel für DBs:
Bekannt und erprobt
RethinkDB
Was soll rein:
billing, clicks, conversion
session Verläufe (langzeit Archiv)