Coup d’œil sur les Personas, les avatars réalistes de visionOS

Félix Cattafesta |

Apple n’a pas choisi la solution la plus simple pour représenter un porteur de Vision Pro dans visionOS. Là où l’on aurait pu s’attendre à voir les habituels Memojis cartoonesques, Cupertino a préféré opter pour des Personas, c'est-à-dire des avatars réalistes. Ceux-ci prennent place lors des appels FaceTime, faute de caméra frontale pouvant filmer l'utilisateur. Comment créer un Persona et à quoi ça ressemble ? Suivez le guide.

Le Vision Pro vous incite à créer votre Persona dès la configuration initiale de visionOS. Si la fonctionnalité est accolée d’un gros badge « Beta », elle reste importante pour Apple car elle permet de vous représenter dans FaceTime, Zoom et consorts. Sans elle, l’appareil considère simplement que vous n’avez pas de webcam et se contente d’afficher un écran noir ou votre fiche de contact.

Si vous ne l’avez pas fait au premier démarrage, la création d’un Persona se lance depuis les Réglages de visionOS. Après une courte vidéo de présentation, le casque vous incite tout d’abord à refaire un scan de vos mains, puis à l’enlever pour le tenir au niveau de votre visage. Le système utilise les différents capteurs du Vision Pro pour scanner votre tête et en proposer une reproduction fidèle. Ou tout du moins, il essaye.

Image WatchGeneration.

Face au casque, il faut effectuer quelques mouvements : tourner la tête à droite, à gauche, en haut et en bas, à la manière d’une configuration Face ID. Il faut aussi sourire en montrant ses dents, hausser les sourcils ou encore fermer les yeux. La démarche prend une à deux minutes, et l’appareil mouline ensuite pour générer votre avatar.

Mon Persona sur visionOS 1.0.3.

avatar Moebius13 | 

Les avatars « réalistes » ? On est en plein dans la vallée dérangeante, c’est juste affreux, je ne voudrai pas que l’on interlocuteur voit ça.

Je suis bien plus enthousiaste quant à la possibilité introduire avec iOS 17 de pouvoir faire du FaceTime en projetant l’image sur sa TV.

Je m’en sers avec mes parents, je leur ai acheté un petit dock que j’ai réglé pour que la caméra soit bien orienté et positionné quand ils sont sur le canapé et j’ai fait de même chez moi.

C’est un plaisir quand on s’appelle en FaceTime de communiquer sur nos écrans (88 pouces chez moi, 75 chez eux), et pour qu’ils puissent voir leurs petits enfants.

Ça c’est quelque chose qui rapproche les gens et les familles, ça c’est une petite innovation qui compte beaucoup même si ça n’a l’air de rien, et c’est selon moi beaucoup mieux que « les Personas » et la communication via VisionOS.

Et je n’ose imaginer une conservation entre deux personnes utilisant un Vision Pro, un avant goût de film d’horreur….

avatar Michaeel | 

@Moebius13

Quel dock avez-vous choisi ?

avatar Moebius13 | 

@Michaeel

Un dock sur Amazon, la marque c’était Lamicall je crois

avatar Michaeel | 

@Moebius13

Ok merci.

avatar Malouin | 

@Moebius13

Je suis assez ok avec toi… Pour autant, je ne partage pas le côté « pas convaincant ». Il s’agit d’une première version.
Je pense que si tu relis ton commentaire dans 5 ans, tu le trouveras totalement décalé…
Désirable ou pas, je pense que nous voyons l’Avenir se dérouler sous nos yeux.

avatar Oliviou | 

@Moebius13

L’être humain est fait pour prendre ce qu’il a devant lui pour un humain. Sur n’importe quelle forme abstraite, pour peu qu’elle soit fermée, il suffit de dessiner un cercle avec point dedans pour qu’on identifie un œil et que notre cerveau construise autour une créature consciente et lui donne un caractère, alors que c’est toujours la même forme abstraite.
Là il y a en plus la voix, le regard direct, les mouvements… Quelques minutes de conversation avec cet avatar (ou d’autres pires que ceux-là) suffisent à duper le cerveau, et à lui faire oublier l’étrangeté de ce truc carrément repoussant de prime abord.
Bien sûr ça finira par s’améliorer, mais c’est curieusement deja efficient.

avatar Moebius13 | 

@Oliviou

Non ça ne marche pas comme ça, Masahiro Mori, qui est à l’origine du concept de « la vallée dérangeante » explique au contraire que plus quelque chose se rapproche de l’humain sans l’être totalement, plus ses imperfections vont nous sauter aux yeux et nous paraître horribles (le mot horribles n’est pas galvaudé, c’est le sien), et notre cerveau ne va pas s’y habituer, il va systématiquement chercher et détecter c’est imperfections de façon inconsciente.

C’est la raison pour laquelle au début de la 3D, dans Toy Story on ne voit pas de visages humains, c’est en relation avec ce principe.

Les avatars iOS sous formes de Mémojis animés (en plus détaillés) auraient été bien plus pertinents et moins dérangeants et bizarres, au moins le temps que la technologie d’Apple soit assez au point pour que le visage retranscrit par le casque sorte de la vallée dérangeante.

Il y a trop de choses inabouties sur ce casque et à la limite du mensonge, comme le cas de l’écran externe et des yeux du porteurs.
Dans les présentations et les publicités, c’était lumineux et net, on avait vraiment l’impression qu’il y avait une transparence et qu’on voyait les yeux de la personne qui portait le casque.

Dans la réalité c’est très peu lumineux, ça n’est pas net et l’image renvoyée à un léger temps de retard et rend le tout « bizarre ».

Maintenant on comprend pourquoi le petit Timmy n’a pas mis le casque sur scène !
Avez-vous noté cet élément ? À chaque nouveau produit, on a pu voir les dirigeants d’Apple l’essayer, que ce soit Steve Jobs ou Tim Cook, à l’exception notable de ce casque.

La question est : Pourquoi ? Parce que Tim avait conscience qu’il aurait l’air con avec ça que la tête ? Parce qu’il ne voulait pas qu’on voit que la réalité ne correspondait pas à la présentation ? C’est quand même étonnant non ?

avatar tuffeha | 

Ce Persona a-t-il été créé sur visionOS 1.1

avatar Félix Cattafesta | 
Tout sur la version 1.0, je vais le préciser.
avatar tuffeha | 

@Felix_

Merci! ☺️

avatar Kestar11 | 

Des différentes vidéos que j’ai vu de ces Personas, ce que je trouve très convaincant c’est les micro-expressions du visages. Franchement, pour une première version, avoir un si haut niveau de détail des différents mouvements du visage est clairement impressionnant.

Je trouve dur de dire que c’est pas beau et mal fait. On est qu’au tout début et quand on voit déjà la différence avec la version 1.1, j’imagine pas d’ici 2-3 ans.

Ça n’empêche pas qu’il y a encore beaucoup de boulot et que ça dépend aussi des visages et des couleurs de peau si j’ai bien compris.

avatar iftwst | 

Oui franchement c’est pas mal du tout !

Cela reste une « représentation » virtuelle qui semble plutôt réussie.

J’avoue ne pas trop comprendre les critiques de ce système. Pas parfait certes, mais prometteur et finalement plus intéressant que les Memojis qui avaient été bien accueillis

avatar XiliX | 

Le plus flippant sera, lorsque les cheveux, vêtements des Personas possèdent un mouvement.
Ce sera tout à fait possible avec l'IA

CONNEXION UTILISATEUR