FreeHAL
Das Computerprogramm FreeHAL ist das am weitesten entwickelte Dialogprogramm, das lernfähig und als freie Software (open source) verfügbar ist. Das Projekt wurde 2006 von Tobias Schulz gegründet und befasst sich mit der Weiterentwicklung dieser künstlichen Intelligenz.Es benutzt semantische Netze und arbeitet mit Mustererkennung, Stemmern, Wortartdatenbanken und Hidden Markov Modellen, um in Gesprächen ein möglichst menschliches Verhalten zu imitieren. Im Gegensatz zu den meisten vergleichbaren Computerprogrammen lernt FreeHAL selbstständig hinzu.
Es unterstützt die Sprachen Deutsch und Englisch, wobei bisher nur für Deutsch eine umfangreiche Wissensdatenbank als semantisches Netz vorliegt. Durch das Kommunizieren per Tastatur wird dieses Wissen erweitert.
FreeHAL kann mit der Online-Version ohne Installation getestet werden.
Das Freehal-Team sucht derzeit C- und Perl-Programmierer, die bereit sind an Freehal aktiv mitzuarbeiten.
Nähere Hinweise sind unter Mitarbeit
zu finden!
Das Teilprojekt FreeHAL@home dient dazu, über möglichst viele Computer verteilt Datenbanken zu konvertieren oder zu generieren, um Fakten aus im Internet verfügbaren Texten für das Hauptprojekt nutzbar zu machen. Das Freehal-Team sucht derzeit C- und Perl-Programmierer, die bereit sind an Freehal aktiv mitzuarbeiten.
Nähere Hinweise sind unter Mitarbeit
zu finden!Konkret handelt es sich um Semantische Netze, die mittelfristig im offiziellen Download enthalten sein werden. Grundsätzlich werden alle über BOINC gewonnen Daten nach einer gewissen Zeit online gestellt, vorher wird durch Stichproben die Fähigkeit FreeHALs überprüft, die Fakten in Schlussfolgerungen verwenden zu können, und es werden Auswertungen über den Tagger- und Parser-Erfolg erstellt, um Bugs zu finden und zu beheben.
Da diese Arbeit über BOINC verteilt durchgeführt wird, können über FreeHAL@home Fakten in natürlicher Sprache in das richtige Format überführt werden, um für den Antwortprozess genutzt werden zu können. Momentan werden die Artikel der deutschen und englischen Wikipedia in semantische Netze umgewandelt, später sind andere Datenquellen wie die freien Projekte ConceptNet und OpenCyc eingeplant. Ebenso wurden bereits freie Thesauri-Datenbanken wie OpenThesaurus in das eigene Format konvertiert.
Da diese Prozesse leicht verteilt gerechnet werden können, bietet sich BOINC an. Für die POS-Tagger werden Hidden Markov-Modelle und vorgegebene statistische Daten verwendet.
Unterstützer
News
All news Hier wird der Fortschritt der aktuellen Versionen FreeHALs dokumentiert.08. April 2010 (19:55)
Heute ist eine neue stabile FreeHAL-Version mit der Versionsbezeichnung "Step 6" erschienen. Sie entspricht der aktuellen SVN-Version und ersetzt die letzte stabile Version vom 19. Dezember 2010. In der letzten Zeit haben wir uns auf zwei Punkte konzentriert:- Das .pro-Datenbankformat wurde durch ein XML-basiertes Format ersetzt. Alle .pro-Dateien werden automatisch in das neue Format konvertiert, neue Daten werden prinzipiell nur noch in xml-Dateien abgespeichert. Das neue Format wird in der Dokumentation unter Dateitypen
erklärt.- Bisher lief die Kommunikation zwischen den kompilierten C-Funktionen und dem in Perl geschriebenen Teil von FreeHAL über einige temporäre Dateien ab. Da dieser Vorgang sehr ineffizient ist, wurde er nun - wie schon länger geplant - durch ein neues IPC-System ersetzt. Die verschiedenen Prozesse nutzen nun unter allen Plattformen Pipes, um gegenseitig Funktionen aufzurufen und Rückgabewerte zu übergeben.
...



