Homophobie Depression Suizid
Homophobie Depression Suizid
Okay, here it is. This is the unofficial official timeline of #AI. I'm going to tell you what to expect, and it's definitely not: this all goes away and we return to before.
Are you ready for this? Are you sure? Well, read on.
Before I continue, I'm going to lay out some AI #benchmarks that we'll use to define "how good / scary is this AI?" This is in rough order of difficulty.
#Lovelace #Test for #Emergence: "Can a system produce surprising and useful outputes that weren't explicitely programmed via weak emergence?"
#Loebner Test: "Can a computer fool casual human judges in text conversations?" ( #Modern #LLM AIs are close to this )
#Turing Test (Original Imitation Game): "A man or a computer and a woman are both answering text interrogations trying to convince them that they are the woman. Can the computer perform as well as the man?" (This was the actual orginial #TuringTest.)
Strengthened #Imitation Game: "A man or a #computer and a woman are both answering text interrogations. Can the computer perform as well as the woman?"
#Coffee Test: "Can a #system enter a strangers house with no prior infor and using #perception, imitation, and #reasoning figure out how to make a cup of coffee?"
#College #Student Test: "Can a robot enroll in college, attend classes like an actual student, learn from the instructions things it didn't know before, and graduate?"
#VoightKampff Test: "Can a machine withstand adversarial exper interrogation and still pass as #human?"
#Harnad's Total Turing Test: "Is the system indistinguishible from humans in every aspect?" (This is a #DuckTest.)
Non #Duck Test: "Even with full access to internals, can experts find no evidence that it isn't a genuine human mind?"
Call Center Workers Are Tired of Being Mistaken for AI - “These people, who spend hours talking to strangers, are experiencing surreal conversations, where customers ask them to prove they are not machines” #turingtest https://it.slashdot.org/story/25/06/28/1740215/call-center-workers-are-tired-of-being-mistaken-for-ai
2/
The #Turing #test has been a kind of gold standard in #AI.
Honey badgers, octopuses or ravens fail it even before the start. Are these beasties stupid? I guess not.
So the #Turingtest is not a measure of #intelligence, just one aspect of human intelligence *maybe*. If you run this test in English and one of your human tests subject is not fluent in this language, he might fail as miserably as the honey badger, after a long agony.
(The honey badger is smarter and ran away long ago)
Another thought about #AI- Alan #Turing was clearly brilliant, has the #TuringTest misled us all?
@rmblaber1956
If you’re ever in a situation where you have to prove that AI is not artificial intelligence, I give you the modern Turing test; a Rubik’s cube.
https://gist.github.com/izabera/3fb2f510f9e29811b57d3702002fc2a2
I was given the amazing opportunity to work with folks at the Canadian Broadcasting Corporation to make a CBC Ideas episode on the #turingtest #artificialintelligence and the #paranormal
You can listen to it here:
Können #LLMs den #turingtest leichter bestehen, weil sie besser geworden sind, oder, weil wir #Menschen maschinen-ähnlich geworden sind?
ChatGPT besteht laut Studie Turing-Test für Psychotherapie
https://the-decoder.de/chatgpt-besteht-laut-studie-turing-test-fuer-psychotherapie/ #ChatGPT #TuringTest #Psychotherapie
“How many "R"s are in the word strawberry?”
… is the new #TuringTest
3/ Eine Bananenschalenschalenschale.
@peer hatte ja die ersten zwei Bilder mit KI erklären lassen. Das Ergebnis war beeindruckend. Jetzt bin ich gespannt, was die #LLMs daraus machen. Wer kann mehr #Quatsch, die LLMs oder ich? =:-)
Meine Vermutung ist immer noch, dass Peer irgendwo einen Premium-Account hat und auf der anderen Seite ein Mensch sitzt. Vielleicht ja ich!
In all the hullabaloo about AI, few people comment how ChatGPT and friends clearly pass the Turing test. I certainly know humans who hallucinate more than ChatGPT does.
Whatever else this generation of “AI” may be, this is a remarkable accomplishment.
Alan Turing published "Computing, Machine and Intelligence" almost 75 years ago. In this month's episode of Cyborg Goddess, I chatted with Simone Natale on his research into the legacy of the Turing Test and the concept of Deceitful Media. Check it out here:
@OhWeh Nein, beim Rassismus gibt es keinen großen Unterschied, würde ich vermuten. (Im statistischen Mittel sind wir alle Scheiße.) Aber bei Ostthemen gibt es gravierende Unterschiede. Deswegen funktioniert ja auch second wave #Ostalgie so gut. Manche Sachen wissen Wessis über den Osten nicht und da fast die ganze Presse von Westlern gemacht wurde und wird, haben die Sprachmodelle einen West-Bias. Mit Ostthemen kann man also West-Menschen oder KIs enttarnen. Entweder mit Faktenwissen oder mit Einstellungen. Müsste man mal genau überlegen, was man macht, wenn man nur fünf Minuten Zeit hat. Es hängt natürlich wesentlich vom Alter des Gegenübers ab. Aber müsste gehen.
Wollen wir spielen? Ich stell Fragen, Ihr antwortet. Mist, wir haben keine Bots. Oder vielleicht spielt @peer wieder den Bot. Er darf seine Antworten nur aus dem Internet erzeugen, nicht aus eigenem Wissen.
3/ Das Problem mit sexistischen und rassistischen Klischees gibt es übrigens auch bezüglich Ostdeutschen, denn die ganze schriftsprachlichen Dokumente, die für Trainings verwendet werden können, sind aus westdeutschem Blick geschrieben.
Vielleicht eignen sich auch Ost-West-Themen für den Turing-Test. Müsste man auch mal probieren. Zumindest Ossis müsste man so rausfischen können.
Hi, hi. #Ossis sind Menschen, bei #Wessis weiß man es nicht so genau.
2/ Als ich noch in der Schule war, haben wir im Ferienhort immer Filme gesehen. Da gab es eine tschechischen Science-Fiction-Film mit Humanoiden. Man konnte sie eigentlich nicht von Menschen unterscheiden. Der Trick war dann, dass man ihnen eine bestimmte Logik-Aufgabe gab. Ihr Kopf fing dann an zu qualmen und sie fielen um. (Kennt jemand den Film?)
Jetzt sind wir als Menschheit gerade dabei, uns ernsthaft mit dem #TuringTest zu beschäftigen:
https://arxiv.org/abs/2405.08007
Ich weiß aber, wie Ihr ganz schnell und ganz sicher entscheiden könnt, ob die Gegenseite ein LLM ist: Ihr fragt einfach etwas, auf das man rassistisch oder sexistisch antworten muss.
Den LLMs wird das dann zu heiß, sie fangen an zu qualmen und kippen um.
Ich würde das gern mal probieren. Wenn jemand Testpersonen braucht, fragt bitte mich.
Interessant wäre ja zu sehen, ob sie einfach Aussagen zum Thema verweigern oder ob sie humanistisch trainiert werden (können). Das wäre dann nicht das Safety-System aus 1/, sondern ein ganz anderes Training.
Über #KI nachdenken so spirituell, uuuuhh. @3sat #nano wiederholt nach @sixtus den guten Beitrag zu #ichbindeinMensch @ct_Magazin #Scobel hat regelmäßig #AI
'LamDa' habe #bewusstsein ,worauf ist Blake Lemoine reingefallen?
Ja, mit dem #Turingtest kommt man nicht weiter. Aber Ein Bewusstsein kann auch konstruiert sein, die KI konstruiert sich eine #Persönlichkeit, indem sie ein Set von Eigenschaften und 'Erinnerungen' als die ihren abspeichert, ein Verzeichnis in ihren Verzeichnisbaum
3/ Meine Theorie ist ja, dass @peer in Wirklichkeit ein bot ist. Wenn die Theorie zutrifft, dann hätte er den #TuringTest bestanden. Peer findet immer zu allem, was ich schreibe, noch interessante Links. Jetzt sogar zu meinen wissenschaftlichen Aufsätzen.
Ich hatte ja behauptet, dass #ChatGPT eine #BullshitMaschine ist. Ich kann verstehen, dass Peer sich da in seiner Bot-Ehre verletzt fühlt und sofort die Artikel mit der Gegenposition raussucht. Also Danke dafür.
Ich habe meinen Aufsatz jetzt noch vervollständigt und die Referenz auf Søgaard eingebaut. Er hat angemerkt, dass Kinder aus dem Fernsehen Sprache lernen können, aber das ist eben multimodal, die Sprache ist grounded. Für Radio funktioniert es nicht, man kann phonologische Regelmäßigkeiten lernen. Das habe ich jetzt hinzugefügt.
Ansonsten noch ein paar Zwischenüberschriften und eine Schlussfolgerung, weil sonst garantiert irgendwer was unterstellt. Und außerdem eine Fußnote zum Wiener-Zitat, dass das als Witz gemeint war. Von ihm hoffentlich auch.
Habt Spaß:
https://ling.auf.net/lingbuzz/008435
Listening to a relative on the 'phone, on hold, aware that xe is on hold, hearing the repeated pre-recorded message (about using the WWW site instead) interspersed with the hold music, knowing that it is a pre-recorded message, and *still* trying to have a conversation with it and calling it "she" …
… reminds me of what I said some years ago about the 2020s being the decade that we demonstrated that humans are not up to the task of administering the #TuringTest.
An AI/LLM can not pass the Turing Test.
Pit two of them against each other.
They both will hallucinate.