Your browser doesn't support the features required by impress.js, so you are presented with a simplified version of this presentation.

For the best experience please use the latest Chrome, Safari or Firefox browser.

Plausibility Evaluation of DeepFake Detectors

Jost Alemann, Valentin Rieß

Agenda

  1. Aufgabenstellung
  2. Konzept
  3. Datensätze
  4. DeepFake Detektoren
  5. Evaluation
  6. Fazit

Aufgabenstellung

Evaluierung verschiedener DeepFake-Detektoren in Bezug auf deren Plausibilität (genutzter Datensatz, Klassifizierungsunterschiede, Modellkomplexität, Treffsicherheit, ...)

Konzept

Datensätze

Casual Conversations

DeeperForensics-1.0

FakeAVCeleb

DeepFake Detektoren

Deepware

Selimsef

Mesonet

Evaluation

Deepware Fehler

Detektor hat starke Probleme mit dem FakeAVCeleb Dataset. Die Fehler wurden bei den nachfolgenden Diagrammen und Metriken herausgerechnet.

Mesonet Fehler

Alle vortrainierten Mesonet-Varianten geben fast immer einen konstanten Prediction-Wert zurück (1 oder 0 je nach Variante). Mesonet scheint fine-tuning zu benötigen.

Accuracy

Wie oft war der Detektor mit seiner Annahme richtig? \(Accuracy = \frac{TP+TN}{TP+TN+FP+FN}\)

Accuracy DeeperForensics
Accuracy FakeAVCelebs

Bei DF_e2e dominiert Selimsef.
Bei FAVC sind die Detektoren an sich gleichauf aber Deepware hat nur 1/4 untersucht.

Precision

Wie viele erkannte Fakes sind tatsächlich Fakes? \(Precision = \frac{TP}{TP+FP}\)

Precision DeeperForensics
Precision FakeAVCelebs

Bei beiden dominiert Selimsef minimal.

Recall / TPR

Wie viele Fakes wurden tatsächlich als Fakes erkannt? \(Recall = \frac{TP}{TP+FN}\)

Recall DeeperForensics
Recall FakeAVCelebs

Selimsef erkennt Fake-Videos zuverlässiger als solche.

Kompression und Artefakte (DeeperForensics)

Wie beeinflussen sie den Recall/TPR der Detektoren?

Recall DF Deepware
Recall DF Deepware

Kompression und Artefakte haben einen messbar negativen Einfluss auf die korrekte Erkennung von Fakes

Ethnien (FakeAVCeleb)

Wie beeinflussen sie den Recall/TPR der Detektoren?

Recall FAVC Deepware
Recall FAVC Deepware

Ethnie der abgebildeten Personen in den Fakes beeinflusst die korrekte Erkennung von Fakes.

FPR (Casual Conversations)

Wie viele echte Videos werden als Fakes klassifiziert?

FPR CC

Unmodifizierte Videos werden mit hoher Zuversicht als nicht-Fakes klassifiziert.

Receiver Operating Characteristic (ROC)

Das Verknüpfen von TPR und FPR an den Threshold-Werten erlaubt die Erstellung einer ROC-Kurve. Qualitätsmaß, wie gut der Klassifikator zwischen Klassen unterscheiden kann.

Kompression und Artefakte (DeeperForensics)
ROC Deepware DF
ROC Selimsef DF
Ethnien (FakeAVCeleb)
ROC Deepware FAVC
ROC Selimsef FAVC
AUC (area under ROC curve)

Fazit

Detektoren

Deepware

Selimsef

Mesonet

Ausblick

Disclaimer

No digital privacy was harmed in the making of this presentation.
No data were sent to Prezi, Google, Microsoft, etc.

Use a spacebar or arrow keys to navigate.
Press 'P' to launch speaker console.