photog.social is one of the many independent Mastodon servers you can use to participate in the fediverse.
A place for your photos and banter. Photog first is our motto Please refer to the site rules before posting.

Administered by:

Server stats:

249
active users

#turingtest

0 posts0 participants0 posts today
Continued thread

2/
The #Turing #test has been a kind of gold standard in #AI.
Honey badgers, octopuses or ravens fail it even before the start. Are these beasties stupid? I guess not.
So the #Turingtest is not a measure of #intelligence, just one aspect of human intelligence *maybe*. If you run this test in English and one of your human tests subject is not fluent in this language, he might fail as miserably as the honey badger, after a long agony.
(The honey badger is smarter and ran away long ago)

Replied in thread

@OhWeh Nein, beim Rassismus gibt es keinen großen Unterschied, würde ich vermuten. (Im statistischen Mittel sind wir alle Scheiße.) Aber bei Ostthemen gibt es gravierende Unterschiede. Deswegen funktioniert ja auch second wave #Ostalgie so gut. Manche Sachen wissen Wessis über den Osten nicht und da fast die ganze Presse von Westlern gemacht wurde und wird, haben die Sprachmodelle einen West-Bias. Mit Ostthemen kann man also West-Menschen oder KIs enttarnen. Entweder mit Faktenwissen oder mit Einstellungen. Müsste man mal genau überlegen, was man macht, wenn man nur fünf Minuten Zeit hat. Es hängt natürlich wesentlich vom Alter des Gegenübers ab. Aber müsste gehen.

Wollen wir spielen? Ich stell Fragen, Ihr antwortet. Mist, wir haben keine Bots. Oder vielleicht spielt @peer wieder den Bot. Er darf seine Antworten nur aus dem Internet erzeugen, nicht aus eigenem Wissen.

Continued thread

3/ Das Problem mit sexistischen und rassistischen Klischees gibt es übrigens auch bezüglich Ostdeutschen, denn die ganze schriftsprachlichen Dokumente, die für Trainings verwendet werden können, sind aus westdeutschem Blick geschrieben.

Vielleicht eignen sich auch Ost-West-Themen für den Turing-Test. Müsste man auch mal probieren. Zumindest Ossis müsste man so rausfischen können.

Hi, hi. #Ossis sind Menschen, bei #Wessis weiß man es nicht so genau.

Continued thread

2/ Als ich noch in der Schule war, haben wir im Ferienhort immer Filme gesehen. Da gab es eine tschechischen Science-Fiction-Film mit Humanoiden. Man konnte sie eigentlich nicht von Menschen unterscheiden. Der Trick war dann, dass man ihnen eine bestimmte Logik-Aufgabe gab. Ihr Kopf fing dann an zu qualmen und sie fielen um. (Kennt jemand den Film?)

Jetzt sind wir als Menschheit gerade dabei, uns ernsthaft mit dem #TuringTest zu beschäftigen:

arxiv.org/abs/2405.08007

Ich weiß aber, wie Ihr ganz schnell und ganz sicher entscheiden könnt, ob die Gegenseite ein LLM ist: Ihr fragt einfach etwas, auf das man rassistisch oder sexistisch antworten muss.

Den LLMs wird das dann zu heiß, sie fangen an zu qualmen und kippen um.

Ich würde das gern mal probieren. Wenn jemand Testpersonen braucht, fragt bitte mich.

Interessant wäre ja zu sehen, ob sie einfach Aussagen zum Thema verweigern oder ob sie humanistisch trainiert werden (können). Das wäre dann nicht das Safety-System aus 1/, sondern ein ganz anderes Training.

arXiv.orgPeople cannot distinguish GPT-4 from a human in a Turing testWe evaluated 3 systems (ELIZA, GPT-3.5 and GPT-4) in a randomized, controlled, and preregistered Turing test. Human participants had a 5 minute conversation with either a human or an AI, and judged whether or not they thought their interlocutor was human. GPT-4 was judged to be a human 54% of the time, outperforming ELIZA (22%) but lagging behind actual humans (67%). The results provide the first robust empirical demonstration that any artificial system passes an interactive 2-player Turing test. The results have implications for debates around machine intelligence and, more urgently, suggest that deception by current AI systems may go undetected. Analysis of participants' strategies and reasoning suggests that stylistic and socio-emotional factors play a larger role in passing the Turing test than traditional notions of intelligence.

Über #KI nachdenken so spirituell, uuuuhh. @3sat #nano wiederholt nach @sixtus den guten Beitrag zu #ichbindeinMensch @ct_Magazin #Scobel hat regelmäßig #AI

'LamDa' habe #bewusstsein ,worauf ist Blake Lemoine reingefallen?
Ja, mit dem #Turingtest kommt man nicht weiter. Aber Ein Bewusstsein kann auch konstruiert sein, die KI konstruiert sich eine #Persönlichkeit, indem sie ein Set von Eigenschaften und 'Erinnerungen' als die ihren abspeichert, ein Verzeichnis in ihren Verzeichnisbaum

Continued thread

3/ Meine Theorie ist ja, dass @peer in Wirklichkeit ein bot ist. Wenn die Theorie zutrifft, dann hätte er den #TuringTest bestanden. Peer findet immer zu allem, was ich schreibe, noch interessante Links. Jetzt sogar zu meinen wissenschaftlichen Aufsätzen.

Ich hatte ja behauptet, dass #ChatGPT eine #BullshitMaschine ist. Ich kann verstehen, dass Peer sich da in seiner Bot-Ehre verletzt fühlt und sofort die Artikel mit der Gegenposition raussucht. Also Danke dafür.

Ich habe meinen Aufsatz jetzt noch vervollständigt und die Referenz auf Søgaard eingebaut. Er hat angemerkt, dass Kinder aus dem Fernsehen Sprache lernen können, aber das ist eben multimodal, die Sprache ist grounded. Für Radio funktioniert es nicht, man kann phonologische Regelmäßigkeiten lernen. Das habe ich jetzt hinzugefügt.

Ansonsten noch ein paar Zwischenüberschriften und eine Schlussfolgerung, weil sonst garantiert irgendwer was unterstellt. Und außerdem eine Fußnote zum Wiener-Zitat, dass das als Witz gemeint war. Von ihm hoffentlich auch.

Habt Spaß:
ling.auf.net/lingbuzz/008435

Listening to a relative on the 'phone, on hold, aware that xe is on hold, hearing the repeated pre-recorded message (about using the WWW site instead) interspersed with the hold music, knowing that it is a pre-recorded message, and *still* trying to have a conversation with it and calling it "she" …

… reminds me of what I said some years ago about the 2020s being the decade that we demonstrated that humans are not up to the task of administering the #TuringTest.