Une IA qui dessine une image avec des ondes cérébrales

Zijiao Chen peut lire dans votre esprit à l’aide de puissantes machines d’intelligence artificielle et d’IRMf.

Chen, doctorant à l’Université nationale de Singapour, faisait partie d’une équipe de recherche qui a montré que les scintigraphies cérébrales humaines peuvent être déchiffrées pour déterminer ce que les gens envisagent. Article publié en novembre.

Leur équipe, composée de chercheurs de l’Université nationale de Singapour, de l’Université chinoise de Hong Kong et de l’Université de Stanford, a demandé aux participants de soumettre plus de 1 000 photographies (camions de pompiers rouges, bâtiments gris, girafes mangeant des feuilles – imagerie par résonance magnétique fonctionnelle) Les signaux cérébraux résultants ont été enregistrés au fil du temps à l’intérieur (IRMf), et les chercheurs ont ensuite envoyé ces signaux à un modèle d’IA pour associer des schémas cérébraux spécifiques à des images spécifiques.

Ensuite, lorsque le sujet voit une nouvelle image sur l’IRMf, le système détecte les ondes cérébrales du patient, génère une brève description de ce à quoi ces ondes cérébrales sont censées correspondre et déclenche un générateur d’images AI.Utilisez l’image vue par le participant.

Les résultats sont étonnants et oniriques. L’image de la maison et de l’allée s’est transformée en un amalgame tonal pour la chambre et le salon. Une tour en pierre ornée présentée aux participants à l’étude a généré des images d’une tour similaire avec des fenêtres placées à des angles irréalistes. L’ours est devenu une étrange créature poilue ressemblant à un chien.

L’image résultante correspondait aux attributs (couleur, forme, etc.) et à la signification sémantique de l’image d’origine environ 84 % du temps.

Des chercheurs travaillent à convertir l’activité cérébrale en images dans le cadre d’une étude sur l’analyse cérébrale par IA à l’Université nationale de Singapour.Nouvelles de la BNC

en attendant expérience Il faut environ 20 heures pour former un modèle sur l’activité cérébrale de chaque participant avant que des images puissent être déduites des données d’IRMf, mais les chercheurs pensent que la technologie peut être utilisée par n’importe qui, n’importe où, en seulement 10 ans.

“Cela pourrait aider les patients handicapés à récupérer ce qu’ils ont vu et pensé”, a déclaré Chen. Dans un cas idéal, a ajouté Chen, les humains n’auraient même pas besoin d’utiliser des téléphones portables. “Nous pouvons juste penser.”

Bien que les résultats n’aient impliqué qu’une poignée de sujets de recherche, les découvertes indiquent que les enregistrements cérébraux non invasifs de l’équipe pourraient être une première étape vers un décodage plus précis et plus efficace des images de l’intérieur du cerveau.

Les chercheurs travaillent sur des techniques pour déchiffrer l’activité cérébrale depuis plus d’une décennie. Et de nombreux chercheurs en IA travaillent actuellement sur diverses applications neuro-liées de l’IA. méta et le Université du Texas à Austin Décoder la parole et le langage.

Jack Gallant, un scientifique de l’Université de Californie à Berkeley, a commencé à étudier le décodage cérébral en utilisant un algorithme différent il y a plus de dix ans. Il a déclaré que le rythme auquel la technologie est développée dépendra non seulement des modèles (dans ce cas, l’IA) utilisés pour décoder le cerveau, mais aussi des appareils d’imagerie cérébrale et de la quantité de données disponibles pour les chercheurs de rizière. Le développement de machines IRMf et la collecte de données présentent des obstacles pour ceux qui étudient le décodage cérébral.

« C’est comme aller au Xerox PARC dans les années 1970 et dire : ‘Oh regardez, mettons des PC sur nos bureaux à tous’ », explique Gallant.

Il a déclaré que le décodage cérébral pourrait être utilisé en médecine au cours de la prochaine décennie, mais qu’il est encore à des décennies du grand public.

Mais c’est le dernier né du boom technologique de l’IA qui a captivé l’imagination du public. Les médias générés par l’IA, des images et des sons aux sonnets et dissertations de Shakespeare, c’est ce que la technologie a fait ces dernières années, d’autant plus que le soi-disant modèle de transe a permis de fournir de grandes quantités de données à l’IA. Apprenez les modèles rapidement.

L’équipe de l’Université nationale de Singapour a utilisé un logiciel d’intelligence artificielle générateur d’images appelé Stable Diffusion. Ce logiciel, qui a été adopté dans le monde entier, génère des images stylisées de chats, d’amis, de vaisseaux spatiaux et de tout ce qu’une personne pourrait demander.

Le logiciel permet au professeur agrégé Helen Zhao et à ses collègues de résumer les images à l’aide d’un vocabulaire de couleurs, de formes et d’autres variables pour créer des images quasi instantanées en diffusion stable.

Les images produites par le système sont thématiquement fidèles aux images originales, dit-elle, mais elles ne correspondent pas aux photographies car les individus ont des perceptions différentes de la réalité.

“Quand vous voyez de l’herbe, je pense aux montagnes, vous pensez aux fleurs et d’autres pensent aux rivières”, a déclaré Zhao.

L’imagination humaine peut faire une différence dans la production d’images, a-t-elle expliqué. Mais la différence pourrait également être le résultat de la capacité de l’IA à cracher différentes images à partir du même ensemble d’entrées.

Les modèles d’IA reçoivent des « jetons » visuels pour générer des images des signaux du cerveau humain. Ainsi, au lieu d’un vocabulaire de mots, on vous donne un vocabulaire de couleurs et de formes qui, ensemble, créent une image.

Image générée à partir de l'IA.
Image générée à partir de l’IA.Fourni par l’Université nationale de Singapour

Cependant, ce système est loin d’être répandu, car il nécessite une formation assidue basée sur les ondes cérébrales d’une personne spécifique.

“La vérité est qu’il y a encore beaucoup de place à l’amélioration”, a déclaré Zhao. “En gros, vous devez entrer dans le scanner et regarder des milliers d’images, puis vous pouvez réellement faire une prédiction.”

Bien qu’il soit encore impossible de faire venir des étrangers dans la rue et de lire dans leurs pensées, “nous cherchons à généraliser l’ensemble du sujet à l’avenir”, a-t-elle déclaré.

Comme de nombreux développements récents de l’IA, les techniques de lecture cérébrale soulèvent des préoccupations éthiques et juridiques. Certains experts disent que les modèles d’IA pourraient être utilisés à des fins d’interrogatoire et de surveillance.

“Je pense que la frontière entre l’autonomisation et l’oppression est très mince”, a déclaré Nita Farahany, professeur de droit et d’éthique des nouvelles technologies à l’Université Duke. “À moins que nous ne prenions de l’avance sur nous-mêmes, je pense que nous sommes plus susceptibles d’être témoins des effets oppressifs de cette technologie.”

Elle craint que le décodage cérébral de l’IA ne conduise à la commercialisation de l’information par les entreprises et à l’utilisation abusive de l’information par les gouvernements, et il existe de nombreuses autres entreprises qui sont déjà sur le marché ou sur le point de l’être. a le potentiel d’apporter plus que le simple partage de lectures cérébrales. , mais a été jugé pour eux.

“C’est un monde où l’activité cérébrale est collectée, les états cérébraux (de l’attention à la concentration) sont surveillés et les gens sont embauchés, licenciés et promus en fonction de ce que leurs indicateurs indiquent”, a-t-elle déclaré. ”

“Il est déjà en train de décoller et doit avoir une gouvernance et des droits en place maintenant avant qu’il ne puisse vraiment faire partie de la vie quotidienne de chacun”, a-t-elle déclaré.

Des chercheurs de Singapour continuent de développer la technique dans l’espoir de réduire d’abord le temps que les sujets doivent passer dans l’appareil d’IRMf. Augmentez ensuite le nombre de sujets à tester.

“Je pense que c’est possible à l’avenir”, a déclaré Zhao. “et [a larger] La quantité de données disponibles pour les modèles d’apprentissage automatique permet d’obtenir des performances encore meilleures. ”

Leave a Comment