Ein Team der kanadischen Concordia-University hat eine Technik entwickelt, um AutorInnen anonymer E-Mails identifizieren zu können – mit einer Sicherheit von 80-90 Prozent, behaupten die ForscherInnen.
Analog zur Einzigartigkeit von Fingerabdrücken (fingerprints) gehen sie davon aus, dass es eindeutig nachweisbare „Schriftabdrücke“ (write-prints) gibt, die AutorInnen charakterisieren. Die Methode sei ausreichend sicher, um gerichtsfeste Beweise liefern zu können.
Mark Schaver beschreibt, dass sowohl Techniken der Spracherkennung als auch Data Mining in die Methode einfließen. Der Artikel des Teams zu ihrer Methode, „Mining writeprints from anonymous e-mails for forensic investigation“, erschien bereits im Oktober in Digital Investigation, umsonst auch hier.
Many criminals exploit the convenience of anonymity in the cyber world to conduct illegal activities. E-mail is the most commonly used medium for such activities. Extracting knowledge and information from e-mail text has become an important step for cybercrime investigation and evidence collection. Yet, it is one of the most challenging and time-consuming tasks due to special characteristics of e-mail dataset. In this paper, we focus on the problem of mining the writing styles from a collection of e-mails written by multiple anonymous authors. (Aus der Einleitung)
Die „effektive neue Methode“ wird in einem Bericht der Universität mit der Notwendigkeit der Geißeln der digitalen neuen Welt begründet: Kinderpornografie, Kommunikation zwischen Kriminellen und Computerviren. Nachdem es mittlerweile zu den üblichen Ermittlungstechniken gehöre, über die IP-Adresse festzustellen, von welchem Ort eine Mail geschrieben wurden, bleibt aber noch offen, wer sie geschrieben hat. Diese Lücke soll mit der neuen Technologie geschlossen werden, die auch in der Lage sein soll, Gender, Nationalität und Bildungshintergrund festzustellen:
To determine whether a suspect has authored the target email, they first identify the patterns found in emails written by the subject. Then, they filter out any of these patterns which are also found in the emails of other suspects. The remaining frequent patterns are unique to the author of the emails being analyzed. They constitute the suspect’s ‘write-print,’ a distinctive identifier like a fingerprint. “Let’s say the anonymous email contains typos or grammatical mistakes, or is written entirely in lowercase letters,” says Fung. “We use those special characteristics to create a write-print. Using this method, we can even determine with a high degree of accuracy who wrote a given email, and infer the gender, nationality and education level of the author.” (Identifying ‚anonymous‘ email authors)
Mir ist wird nicht klar, wo der Unterschied zur bereits üblichen linguistischen Analyse von Texten liegt, ob die nun digital oder analog vorliegen, was ja nicht erst seit gestern in polizeilichen Ermittlungen eingesetzt wird: Erleuchtendes bitte gern in den Kommentaren.