Salut Mathieu,

Le 28/11/2013 13:33, Mathieu Goessens a écrit :
Pour moi, cet effort de personnalisation est voué à l'échec. Ceci pour deux raisons principales.

La première étant que cette personnalisation se base sur des profiles explicites, que l'on demande à l'utilisateur de remplir pour décrire ses centres d'intérêts.
J'ai assister à la session sur User Personalisation au Mozilla Festival animée par Justin Scott et il était clair que le profile est tiré de l'historique avec des heuristiques. Il est demandé à l'utilisateur d'ajuster, mais pas de créer de zéro. L'utilisateur a l'option de faire confiance aveuglément à ce qui est proposé par défaut.

A ce qu'il disait aussi, Mozilla ne s'avance pas trop sur cette question encore (release de produit), parce que si les heuristiques donnent des résultats pourris, la presse va s'en emparer, donner une première mauvaise vague de retours ce qui risque de tuer l'initiative à l'éclosion.

Tout le défi va être de faire un outil suffisamment bon pour que pour 90% des gens (et surtout les journalistes ?), les résultats soient cohérents à 80%. Et ce défi se heurte à certaines limitations que tu cites.

Cette approche se heurte à de nombreuses limites:

- Les choix sont forcements limités et ne sont pas forcement assez
précis pour faire une personnalisation efficace. Par exemple, il est
possible de dire que l'on aime la musique, mais sans être plus précis, et sans pouvoir dire que l'on aime la musique rock et surtout pas la musique électronique.
Ca peut faire partie du travail d'ajustement/affinement par l'utilisateur.
C'est un problème violent qui touche à la sémantique et qui va avoir du mal à être adapter de locale en locale. Après peut-être qu'une modélisation simple des centres d'intérêts humains (lol) peut être suffisamment satisfaisante pour la personalisation de contenu.

Si tu veux aider sur ce problème, l'initiative est ouverte aux idées, Justin Scott est un bon point d'entrée.

- Le fait de demander à l'utilisateur lui même de remplir ces profiles
pourrait sembler une bonne idée, toutefois cela implique que ces
profiles ne seront pas forcement justes:
L'utilisateur ajuste/affine plutôt que de créer, mais quand bien même. Le but n'est pas d'arriver à des profiles parfaits, mais des profiles suffisamment précis pour rendre la personalisation de contenu pertinente. Un problème un peu différent.

certains centres d'intérêt
peuvent être volontairement ou involontairement oubliés. Posez vous la question: êtes vous capables de décrire avec précision vos 10 centres d'intérêts principaux ? Êtes vous sur de ne pas en oubliez ? Allez vous oser dire que vous êtes intéresses par les articles people et les vidéos de chat ? Et si vous deviez donner un ordre ou des scores, donneriez vous les bons ?
Le profil est créé à partir de l'historique. Il y a une forme de "profile de facto" qui permet de ne pas être trop biaisé par la personne qui le créérait ex nihilo. Par contre, il y a un risque d'effet miroir et de blesser des égos cependant...

- À l'inverse de ces profiles explicites et limités, le tracking web,
permet d'avoir une vue bien plus large et bien plus complète des centres d'intérêts des utilisateurs. Typiquement amazon en sait bien plus sur ce que je risque d'acheter via la liste des produits que je consulte, que si je lui disais que je suis intéressé par la science fiction et la musique rock et qu'il devait utiliser ces seules informations. Au delà de tout aspect "politique", imaginer que ces profiles explicites pourront un jour remplacer ce tracking est illusoire. Dans le meilleur des cas, cela peut servir au site de "bootstrap" et de complément: compléter les profiles issus du tracking ou commencer à les remplir quand aucun tracking n'a encore été fait, mais certainement pas se reposer dessus.

(La littérature scientifique sur ce sujet est nombreuse, je n'ai pas
d'article de référence en tête mais une recherche sur google scholar vous donnera "quelques" études scientifiques sur le sujet)
Je me suis fait la même remarque. Peut-être que je me trompe, mais il est possible que cette initiative aille de paire avec le bloquage des cookies tiers + cookie clearing house. En gros, avec le bloquage des cookies tiers, l'industrie pub s'est mise à pleurer de perdre doucement les données qui lui permettent d'être efficace. Il est possible que la personalisation de contenus soit la réponse de Mozilla. En gros, que ça soit un compromis qui permette à la fois que les publicitaires ne perdent pas tout, mais que Mozilla puisse défendre plus aggressivement sa position.

La seconde raison, est plus politique: ce mécanisme de personnalisation revient à donner encore plus d'informations aux sites
Essayons de pré-supposer la bonne foi d'une initiative qui en arrive au stade de la communication officielle de Mozilla ? Est-ce que Mozilla se lancerait sérieusement dans quelque chose qui réduit le pouvoir des utilisateurs ?
;-)

et espérer que ceux-ci traqueront moins les utilisateurs en retour. Au delà de l'aspect illusoire à de cette proposition, on peut s'interroger sur l aspect protection de ces informations, et de la vie privée de l'utilisateur.

Si je me souviens bien comment s'est implémenté: a) l'utilisateur décrit ses intérêts. b) le site décrit les contenus proposés en rapport avec différents centres d'intérêts. c) Le navigateur compare ses deux informations et envoie au site la liste des contenus offerts par le susceptible d'intéresser l'utilisateur. d) Le site envoie des contenus personnalisés. Corrigez moi si je me trompe.
A la hache, c'est ce que j'ai compris aussi. Juste pour clarifier le point b, le site n'a aucune idée des intentions de l'utilisateurs lors d'une première visite. J'ai vu un screenshot à MozFest qui suggérait que pour le point c, le navigateur offre un doorhanger qui dirait "ce site a des contenus de tels types, indiquer ceux qui vous intéressent (liste de mots avec certains pré-cochés par le navigateur d'après les intérêts de l'utilisateur)". Ce qui donne beaucoup plus de contrôle à l'utilisateur que si le navigateur envoi tout seul.

Ainsi, même si le contrôle des informations exposées est fait par le
navigateur, cela revient tout de même à exposer plus d'informations.
Je ne comprends pas pourquoi.

C'est bel et bien le site qui fait la personnalisation et non le
navigateur.
C'est le site qui fait le contenu. C'est lui qui est le plus à même à personaliser le contenu.

Celui-ci se contente de lui envoyer des informations pour permettre cette personnalisation. Aussi, il me semble qu'il eu été envisageable d'incorporer des protections:

- Méthode bourrine: Demander au site d'envoyer tous ses contenus, avec un tag, décrivant le(s) centre d'intérêt(s) associé(s), et filtrer ces contenus depuis le navigateur.

- Un peu plus économique en bande passante: utiliser la méthode
proposée/actuelle mais envoyer quelques centres d'intérêt bidons (du bruit) et les filtrer sur le navigateur toujours en utilisant des tags. Le site aurait la garantie d'avoir envoyé des informations
personnalisées et donc susceptibles d'intéresser ses utilisateurs et
l'utilisateur saurait que des informations ont été envoyées mais qu'une partie de ces informations était fausses laissant un doute sur le fait qu'il soit effectivement intéressé ou non par tel sujet. (Cela pose par contre comme contrainte de pouvoir masquer au site quels contenus on été affiches, on en parlait justement avec David, ca n'est pas forcement évident :) )
Si tu demandes à l'utilisateur, il peut aussi choisir de rajouter du bruit aux résultats

- Il est même tout a fait possible de faire du filtrage efficace,
uniquement cote navigateur en full peer-to-peer. L'idée est simple,
c'est du filtrage collaboratif, ou collaborative filtering: on isole les
utilisateurs ayant les mêmes centre d'intérêt en comparant leur profiles (en p2p) et on part du principe que si l'un a été intéressé par une chose, les utilisateurs ayant des intérêts similaires, le seront aussi. Voir http://hal.archives-ouvertes.fr/docs/00/51/56/93/PDF/gossple.pdf pour les détails.
Quand je lis ta description, ça m'inspire un "Mission. Fucking. Accomplished." http://xkcd.com/810/ Parce que c'en est vraiment pas loin :-)


Ces trois propositions quick&dirty, partent de le même idée et du même constat: la méthode proposée revient à donner aux sites des informations leur permettant de personnaliser les contenus, la ou il eu été envisageable, et peut être non moins pertinent de proposer à ceux ci, de personnaliser les contenus pour eux.
Faire attention au fait que certains contenus sont payants/"interdits à partager" et que le site ne va pas forcément accepter soit d'envoyer son contenu soit que les gens partagent entre eux. Ils voudront aussi personaliser leur contenu et toute solution de personalisation doit les prendre en compte.

David

_______________________________________________
Moz-fr mailing list
[email protected]
http://mozfr.org/mailman/listinfo/moz-fr

Répondre à