Humane veut réinventer le smartphone, mais sans écran
Humane fait parler d’elle depuis quelques années, à la fois parce que la start-up est composée principalement d’anciens employés d’Apple, et à la fois parce qu’elle n’a pas peur des mystères grandiloquents en promettant d’utiliser la technologie pour faire avancer l’humanité, rien que ça. Derrière ces beaux discours, il n’y avait jusque-là rien de concret, mais l’entreprise a enfin proposé un aperçu de ce qui devrait être son premier produit.
C’était à l’occasion d’une conférence TED Talk qui a eu lieu hier, jeudi 20 avril 2023, et qui n’a pas encore été diffusée. Néanmoins, la vidéo a pu être consultée par quelques journalistes, dont Raymond Wong qui dévoile sur Inverse les premiers détails sur cette nouveauté qui devrait être présentée plus en détails dans les prochains mois. Imran Chaudhri, co-fondateur de Humane après avoir travaillé pendant plus de 20 ans chez Apple, a présenté un prototype. Il n’a pas été question de prix ni de commercialisation, mais il a donné quelques exemples de ce que l’appareil pourrait faire.

On savait que Humane travaillait sur la réalité augmentée sans écran, mais aussi sans casque ou lunettes. Son premier produit n’est pas un smartphone non plus, c’est un appareil que l’on porte sur soi et qui peut servir d’assistant au quotidien. En attendant de voir l’appareil sous toutes ses coutures, on a pu apercevoir un petit module à garder sur soi, avec une partie visible pour filmer ce qui se passe. La présentation s’est faite depuis la poche d’une veste (façon Her), mais on peut imaginer qu’il sera possible de l’accrocher avec une pince, façon iPod nano 6G pour ceux qui s’en souviennent.
Cet appareil se veut indépendant, ce qui implique qu’il intègre tous les composants que l’on trouverait normalement dans un smartphone, sauf un majeur : il n’y a pas d’écran. Il dispose bien d’une caméra et de microphones pour capter son environnement. Il comprend aussi un haut-parleur pour répondre à vos questions et une sorte de vidéo-projecteur qui peut afficher des informations dans la paume de l’utilisateur. L’un des exemples donnés par Imran Chaudhri pendant sa présentation consiste à afficher le nom de la personne qui appelle dans la main, avec des boutons pour répondre ou décliner l’appel.
First demo of the @Humane upcoming AI-powered wearable device. A phone call.
— Ben Geskin (@BenGeskin) April 21, 2023
Thanks @ZarifAli9 for sharing! pic.twitter.com/7qyDScPkOh
Les microphones peuvent être utilisés pour répondre à vos questions, comme un assistant vocal portable. Ils peuvent aussi servir à traduire ce que vous dites dans une autre langue, ce qui a aussi fait l’objet d’une démonstration. Le fondateur explique que la réponse repose sur une voix générée par une IA à partir de sa propre voix, mais alors soit l’enregistrement disponible est de très mauvaise qualité, soit on est encore loin du compte. L’accent québecois pour cette traduction est par ailleurs étonnant, mais on ne sait pas si c’est une démonstration du produit final ou un exemple créé pour les besoins de l’événement avec un employé de Humane.
The @Humane wearable doing English->French AI translation in your own voice... wow. (SOUND ON)
— Ray Wong (@raywongy) April 21, 2023
Video credit @ZarifAli9
Read the exclusive on the Humane wearable's features: https://t.co/TYRmtYPSYI pic.twitter.com/cmAWEU8DFS
Autre démonstration, cette fois impliquant la caméra : Imran Chaudhri place une barre de chocolat devant l’appareil et demande s’il peut la manger. La réponse, transmise par le biais du haut-parleur, indique qu’elle contient des ingrédients déconseillés et suggère qu’il est préférable de s’abstenir. On n’a pas encore les images, mais la présentation a donné d’autres exemples encore de ce que le produit imaginé par Humane pourrait faire, comme un résumé des événements intéressants.
@humane's device helping you decide what you can and cannot eat based on knowing your preferences and dietary restrictions. pic.twitter.com/PFwEAsNxDI
— Michael Mofina (@MichaelMofina) April 21, 2023
Au cœur de cette expérience, Humane veut placer une intelligence dite artificielle, mais attention, pas n’importe laquelle. Celle de la start-up est « bonne » (contrairement aux autres ?) et elle se veut plus personnelle, en vous connaissant plus intimement. L’exemple de la barre de chocolat est intéressant à cet égard : l’appareil répond à la question en tenant compte des goûts ou problèmes alimentaires de l’utilisateur. Les traitements doivent par ailleurs être effectués au maximum en local, même si cet assistant aura forcément besoin d’internet pour répondre.
L’ensemble est intriguant, mais tout ce qu’Imran Chaudhri a présenté pouvait déjà être réalisé par n’importe quel smartphone. Certes, les apps de traduction n’utilisent pas nos propres voix, mais est-ce réellement utile, sachant que la traduction se fait de toute manière en différé ? De manière plus profonde, on peut se demander si Humane n’essaie pas de réinventer le smartphone en supprimant l’écran et si cet exercice de style n’est pas un peu vain. Est-ce vraiment préférable de projeter des informations dans une main ? Sachant que l’utilisateur devra tout autant lever le bras, que gagne-t-on réellement, à part quelques grammes de moins ?

Un appareil sans écran le prive d’un grand nombre d’usages pourtant courants sur nos smartphones, de la vidéo aux jeux vidéo, en passant par des milliers d’apps qui n’auraient plus aucun sens sans un affichage. En échange, on a un appareil que l’on porte toujours sur soi, mais cela existe aussi aujourd’hui : l’Apple Watch et les AirPods remplissent déjà largement le rôle du produit de Humane. Siri peut lui aussi répondre à tout moment, indiquer vocalement qui appelle et traduire du texte. Il leur manque une caméra, certes, mais le smartphone n’est pas loin pour cet usage.
Un smartphone qui a aussi le gros avantage de pouvoir être rangé quand on ne veut pas filmer en permanence une scène. Est-ce que le grand public acceptera de porter un appareil qui enregistre tout ? On ne sait pas si ce sera vraiment le cas, cela dit, car Humane n’a pas prévu de mode automatique pour parler avec son assistant en l’appelant par son nom. On peut le voir dans les démonstrations d’ailleurs, Imran Chaudhri appuie systématiquement sur l’appareil pour lui parler. C’est tant mieux en termes de respect de la vie privée, mais est-ce pratique au quotidien ?
Avant de condamner ce nouveau produit1, attendons la vidéo complète du TED Talk et même la présentation en bonne et due forme de l’appareil avec toutes ses caractéristiques et un prix de vente, tant qu’à faire. Le bref aperçu que l’on a eu jusque-là pose plus de questions qu’il n’apporte de réponses.
Vu ce qui était (très vaguement) promis et les sommes incroyables levées par Humane… je pense que nous tenons notre nouveau MagicLeap ^^
@Kahoxinus
🤣
@falemaster
Je me suis dit la même chose.
Les milliards investis dans Magic Leap n’auront servi à rien.
@Kahoxinus
Carrément. Beaucoup de bruit pour rien. Qui utilisera un téléphone qui partage ses conversations avec tout le monde ? 🤔 ils n’ont pas de vie privée ces gens là ? Niveau sécurité on peut aussi en parler. Ont ils conscience qu’un téléphone (qui j’imagine a un certain prix) simplement accroché à une veste ou sortant d’une poche est un aimant à voleur ? On croirait voir du neo futurisme des années 2000.
J'ai le bullshitomètre qui crépite.
@donatello
Haha oui !
Le seul bon côté là-dedans, c’est que cette boîte a une communication tellement prétentieuse (souvenez-vous du « the rumors are true, the smartphone is dead » de l’an dernier) et est tellement remplie de gens qui adorent s’écouter parler, qu’on peut prendre du plaisir à les regarder se planter sans ressentir le moindre sentiment de culpabilité. J’étais persuadé qu’ils allaient présenter de la merde et je suis quand même déçu, un merveilleux exemple de « overpromise, underdeliver ».
@Rez2a
+1
L’avenir c’est les lentilles ou lunettes, combiné à un assistant plus intelligent que les assistants actuel, qui comprend tout(pas Siri quoi 😁😈).
Les Google Glass était un bon début sortie trop tôt.
Qui sera le premier? Apple, Google, Microsoft? Un nouvelle acteur?
@BleuRooster
Exact c'est vraiment la seule voie possible à mon avis pour qu'on puisse vraiment se passer du smartphone mais il y a encore beaucoup de chemin à parcourir mais peut-être que les IAG pourront nous faire gagner du temps pour atteint atteindre un niveau technologique suffisant pour être capable de créer ce genre de produit.
@BleuRooster
"L’avenir c’est les lentilles ou lunettes"
———-
Pas du tout.
L’avenir c’est l’implant neuronal avant son remplacement intégral (du cerveau).
Les cobayes asiatiques sont tout trouvés.
@MarcMame
C’est pour beaucoup plus tard que les lunettes ou lentilles qui ne sont plus très loins à mon avis. 😁
@MarcMame
+1, j’avais eu la même idée.
@MarcMame
L’avenir c’est la vie en virtuel
@BleuRooster
L’avenir c’est les lentilles, oui sauf qu’il faut passer par autre chose avant. On ne monte pas une montagne sans préparation.
[doublon]
Ca va être chaud pour jouer à Clash of Clans 😅
@anonx
Mdr vraie
La placement de l’appareil est le même que dans certaines scènes du film « Her » (2013), lorsque le héros veut que son IA « voie » le monde réel. L’inspiration semble évidente.
https://business-review.eu/wp-content/uploads/2014/02/joaquin-phoenix.jpg
https://i.redd.it/tjm4hp3i58611.png
@relfa
Bien vu ! J’avais oublié le coup de la poche de chemise.
@nicolasf
Quand je parle d’évidence, je veux dire que ça semble évident a posteriori 😉
Je ne l’ai pas relevé moi-même mais vu sur Twitter. J’avais aussi oublié ce détail de cet excellent film.
Sauf que dans "Her", c'était son téléphone, avec un écran et tout. Là, nous avons la version iPod shuffle ^^
@relfa
Il manque quand même l’essentiel. La voix de Scarlett Johansson. Parce que cette « voix québécoise » dans la démo, comment dire.
Sinon Her est en effet un excellent film.
@vincentn
et surtout on s'en approche à grand pas ...
avoir une interface qui nous écoute et traduit cela en phrases ? ça existe, et c'est même comme ça que je tape mes SMS
avoir une interface qui prend des phrases tapées et est capable de traiter les demandes, de discuter, de donner un avis, voir de faire de l'humour ? ça existe plus ou moins, c'est un peu ChatGPT, et un peu d'autres IA aussi, et je ne parle pas des évolutions de ces modèles ou des IA à venir
avoir une interface qui lit les réponses d'un IA (ou tout simplement n'importe quel texte), ça existe depuis 20 ans et c'est même intégré au Mac, ou avec des générateurs vocaux récents qui sont quasi parfaits niveau tibre, intonation, précision de la lecture
Her est vraiment à nos portes
Un point intrigant de la présentation est qu’il parle de « son » IA, pas d’« une » IA générique comme on en a aujourd’hui. Elle n’a pas de nom.
Il veut sortir du paradigme de l’IA impersonnelle à la Siri ou Alexa. Il nous propose une IA entièrement personnalisée, comme « son IA » qui peut émuler sa propre voix et ses intonations comme dans l’exemple de la traduction en québécois.
Je trouve cet aspect de l’IA personnelle intéressant d’un point de vue conceptuel, et ça ne m’étonnerait pas de voir les autres acteurs s’y mettre plus tard.
@relfa
Oui, mais c’est déjà largement le cas des autres assistants en fait. Siri peut même identifier qui parle et répondre avec le calendrier de la bonne personne, par exemple.
Certes, on n’en est qu’aux balbutiements, mais pas besoin d’un autre appareil que le smartphone et ses accessoires pour ça.
@nicolasf
Fonctionnellement c’est vrai, mais je ne parle même pas du concept de l’appareil qu’ils ont présenté, pour lequel je suis assez déçu après tant de teasing.
Je parle vraiment d’un changement conceptuel dans la perception de l’assistant : il ne s’agit pas d’un énième Siri, Alexa, Bixby, Bard, ou ChatGPT : ici l’IA n’a pas d’identité propre ou même de nom. C’est « mon IA », ton IA, l’IA de ma mère, etc.
Par comparaison, Apple, Amazon ou Google ne parle pas de « votre Siri » ou « votre Alexa ». Elles sont présentées comme leur propre entité.
Je trouve ce changement de paradigme intéressant : l’utilisateur revient au centre, et l’IA n’est qu’un outil parmi d’autres à sa disposition, et pas une personne ou une entité tierce. Elle s’efface au service de l’utilisateur.
@relfa
Ce potentiel changement de paradigme est en effet conceptuellement intéressant : Passer d’un assistant serviteur exterieur à une « voix intérieure ».
Mais cela implique tellement de problématiques de vie privée, de sécurité, de confiance (et d’erreurs potentiellement dangereuses)… que nous en sommes technologiquement, éthiquement… encore loin.
L’avantage aussi d’un smartphone à écran c’est qu’on peut l’utiliser nu 🫢
Tu pourras peut être pincer le bidule sur ton téton 😅
@Raph0658
C’est vrai. Toute une communauté de naturistes qui ne pourront pas utiliser ce nouveau machin.
Mickaël a raison de le souffler : comme souvent, Star Trek sert d’inspiration et de paradigme.
Les objections soulevées me rappellent la tonalité de celles provoquées par la présentation du premier iPhone. Je gage qu’elles seront également périssables.
Il y a quelques années, sur un fil de discussion ici, j’avais écrit qu’il faudrait se débarrasser de l’idée que la surface de travail et d’interaction d’un assistant numérique, regroupant ordinateur portable et terminal de communications, devait se limiter au gabarit physique de l’engin. Je me basais sur les choses déjà vues dans les laboratoires. Ce que propose Humane en est un exemple. Ce ne sera pas le dernier.
Mais il faudra sans doute attendre le moment où Apple, après avoir trait à sec la vache à lait iPhone à écran acromégalique, change de paradigme. Alors, les fanX vireront leur cuti, adorant la nouvelle révélation. En vérité, je vous le dis…
@occam
« Mickaël a raison de le souffler : comme souvent, Star Trek sert d’inspiration et de paradigme. »
J’ignore si c’est une coïncidence, et c’est bien que vous en parlez, grand fan de Startrek, j’étais justement ces temps ci a me demander s’il n’était pas possible d’avoir le communicateur sur la poitrine. Alors j’ai regardé sur Amazon les insignes, on y trouve une commande Bluetooth.
Oui, mais Star Trek, c'est très sympa, mais c'est de la technologie pour l'écran (celui de la télé) : il faut que ce soit visuel, et que le spectateur puisse suivre ce qui se dit.
Perso, je suis déjà très agacé quand les gens dans les transports en commun mettent le haut-parleur pour nous faire profiter de leur conversation, alors là, tous les échanges seront par défaut parlés et publics (bon, on doit pouvoir lire les textos grâce au projecteur laser – sur la surface d'une paume, à un angle qui doit bien faire mal au cou à la longue – mais pour y répondre, il faudra forcément les dicter… on y perd en privacité et surtout en tranquillité pour les voisins (je sais, je rêve un peu, là).
En gros, ça fait très bien dans un film, mais dans la vraie vie, c'est pas terrible. Au passage, vu qu'on parlait de "Her", c'est aussi pour ça que Spike Jonze s'était orienté vers un monde où tous les échanges même de "mails" se passaient de façon vocale : lire silencieusement un écran et tapoter silencieusement pour répondre ne fait pas du bon cinéma…
Nous avons besoin de ces compagnies pour faire évoluer le monde et faire pointer la technologie dans le bon sens.
Ouais parce que si on attend qqchose chez Apple ........c est en tout cas pas sous l ère Cook 🤣🤣🤣
Cela ne donne vraiment pas envie à utiliser, et même d’un point de vue éthique c’est très dérangeant ce produit, très creepy. Ça sent le surfait pour au final quelque chose de nul
@driftirgo
Non, c’est une bonne chose et c’est très hygiénique. Par contre totalement inutile avec Tinder. Mais bon, tant qu’on a pas encore maîtrisé les hologrammes…
L’accent québécois n’est pas étonnant : apparemment leur ancien employeur demande aux québécois comment orthographier le français.
J’abandonnerai volontiers mon iPhone pour ça
Soyons honnêtes, ça ressemble à une merde chinoise de Aliexpress, la genance 🥴
J'attends les IA capables de comprendre mon métier, mes outils, mes workflows (et ceux des autres, bien sur) et de pouvoir ensuite faire mon taf suivant mes demandes
Là ça va être cool ... jusqu'au jour où mon client connaitra le truc et arrêtera de m'appeler