(cross-post de ce post sur le sub open source)

Bonjour à tous 😊

Je viens “faire ma pub” pour vous présenter Redakt.

Redakt est un outil open source qui permet de chiffrer un contenu textuel afin de le publier publiquement sur les réseaux sociaux ou n’importe quelle plateforme. Seuls les utilisateurs ayant l’extension Redakt peuvent lire ce texte.

L’objectif est de limiter l’exposition des contenus que nous publions publiquement sur internet à ces innombrables robots qui scrappe et utilisent nos contenus pour diverses raisons (légitimes ou illégitimes).

L’idée est d’ajouter une touche de “privacy” lorsque nous publions un post, un commentaire ou un message sur un réseau social type Twitter, Facebook, Reddit, etc. Ainsi, votre contenu bénéficie d’un hébergement gratuit, mais n’est pas compréhensible par la plateforme sur laquelle vous le publiez.

Si vous voulez tester, voici le lien pour installer l’extension (Chrome/Brave) : https://redakt.org/browser/

Je posterai un commentaire “redakté” en bas, pour que vous puissiez le déchiffrer.

PS: Pour les intéressés, le lien du repo sur GitHub: https://redakt.org/github/

  • Camus [il/lui]@lemmy.ca
    link
    fedilink
    Français
    arrow-up
    5
    ·
    1 year ago

    Merci pour le partage !

    Intéressant pour contrer les bots, après est-ce qu’ils ne peuvent pas eux-mêmes utiliser l’extension pour parser le contenu ?

    • touzovitch@jlai.luOP
      link
      fedilink
      Français
      arrow-up
      5
      ·
      1 year ago

      Très bonne question ! Dans le contexte actuel ils ne le font pas (trop occuper à agréger des millions de data-point en clair).

      Si les bots s’adaptent (et ils le feront si Redakt est utilisé par une quantité significative d’utilisateurs) alors c’est une course.

      L’objectif est de mettre des batons dans les roues de la collecte massive de données “at scale”. En effet une petite modification dans la manière de chiffrer de Redakt obligerait les bots à s’adapter, hors ce n’est pas scalable.

    • Magnor@lemmy.magnor.ovh
      link
      fedilink
      Français
      arrow-up
      3
      ·
      1 year ago

      Je suis d’accord. Faire tourner un bot avec un headless-chrome est relativement trivial de nos jours, et très courant. Que loupé-je ?

      • touzovitch@jlai.luOP
        link
        fedilink
        Français
        arrow-up
        2
        ·
        1 year ago

        En effet c’est assez trivial si on le compare à du chiffrement E2E qui sécurise aujourd’hui nos communications privées (WhatsApp, Signal, etc.).

        Mais Redakt tente d’ajouter une touche de “privacy” dans un contexte de collecte massive de communication publique.

        Prenons ce forum par exemple. Il sera très certainement scrappé puis utilisé pour entrainé des versions futures de ChatGPT.

        Si chaque posts de ce forum était “redakted”, cela obligerait les data engineers d’OpenAI d’adapté leur dataset face à un flux de données toujours plus hétérogènes à mesure que Redakt change ses méthodes de chiffrement.

        Bien sur, je compte ajouter des options de chiffrement plus complexes dans les versions futures de Redakt. Ainsi les utilisateurs pourraient choisir le niveau de chiffrement de leur contenu.

        • Magnor@lemmy.magnor.ovh
          link
          fedilink
          Français
          arrow-up
          4
          ·
          1 year ago

          En l’occurrence ce n’est pas ma question. Je reformule : de nombreux scrappers passent par des versions headless de chrome pour éviter d’être identifiés comme bots. Ils pourraient donc installer l’extension et lire les posts chiffrés comme un utilisateur lambda. Du coup, qu’est ce qui empêcherait cela ?

          • touzovitch@jlai.luOP
            link
            fedilink
            Français
            arrow-up
            2
            ·
            edit-2
            1 year ago

            Oups, j’avais mal compris. Je me reprends.

            En effet, ils pourraient le faire. Si c’est le cas, l’ajout d’un simple captcha rendrait leur méthode obsolète et les empêcherait donc de “scale”.

            Je ne dis pas que cette méthode est impénétrable. Le but est d’apporter un moyen qui empêcherait le data mining à l’échelle actuelle.

            Le moindre petit changement sur l’extension de Redakt (captcha, input, output, méthode de chiffrement) n’aurait aucun effet sur l’expérience des vrais utilisateurs, mais obligerait les scrappeurs à s’adapter constamment et leur demanderait des ressources (humaine + machine) conséquentes pour mettre à l’échelle.

            • Magnor@lemmy.magnor.ovh
              link
              fedilink
              Français
              arrow-up
              1
              ·
              1 year ago

              Je vois, merci de cette réponse. Cependant les bots sont meilleurs aux captchas que les humains désormais… Je suis d’accord qu’il est possible de leur rendre la vie difficile mais j’ai peur qu’à ce jeu de chat et souris un développeur seul soit perdant d’avance (ceci dit avec empathie, pas mépris !).

              • touzovitch@jlai.luOP
                link
                fedilink
                Français
                arrow-up
                2
                ·
                1 year ago

                Oui en effet moi tout seul ça risque de faire un peu short :p

                Rendre leur vie difficile c’est déjà bien. Redakt est surtout adapté dans un context de publication contenu publique sur Internet. Je ne me fais pas d’illusion, par définition aucun contenu public ne peut être incassable très longtemps.

                • Magnor@lemmy.magnor.ovh
                  link
                  fedilink
                  Français
                  arrow-up
                  2
                  ·
                  1 year ago

                  Je suis 100% pour leur rendre la vie difficile. Mon inquiétude est plus que la on risque de plus compliquer la vie des gens que celles des corpos. Mais Je peux me tromper.

  • Magnor@lemmy.magnor.ovh
    link
    fedilink
    Français
    arrow-up
    4
    ·
    1 year ago

    Se pose la question des applications mobiles, exclues d’entrées car passant par une API, et de la fragmentation de la base utilisateur. L’idée de base est intéressante mais la solution proposée me semble facile à contourner pour les concepteurs de bots et potentiellement dommageable pour les utilisateurs humains.

    • touzovitch@jlai.luOP
      link
      fedilink
      Français
      arrow-up
      3
      ·
      edit-2
      1 year ago

      En effet, cela exclu (à date) une part importante du traffic mondial.

      Je ne suis pas developeur mobile mais une simple application iOS/Android (open source, of course) de navigateur mobile avec Redakt intégré pourrait apporter une solution à ce problème.

      Aussi, il n’est pas dit que dans un futur proche les app mobile de navigateur web ajoute un système de plugin.

      Important de préciser que Redakt ne passe par aucune API (code source: https://redakt.org/github). Le chiffrement/déchiffrement se fait entièrement localement sur votre machine.

      • Magnor@lemmy.magnor.ovh
        link
        fedilink
        Français
        arrow-up
        2
        ·
        edit-2
        1 year ago

        Je pensais aux applications mobiles (ex Thunder pour Lemmy, l’application Mastodon, etc). Celles ci seraient de fait exclues.

        Rendre nos contributions illisibles pour la majorité des humains sur le net me semble contre productif.

        • touzovitch@jlai.luOP
          link
          fedilink
          Français
          arrow-up
          3
          ·
          edit-2
          1 year ago

          Sur une instance Lemmy comme celle-ci qui cherche de la visibilité, cela ne va pas de soit en effet.

          Mais qu’en est-il du contenu publié sur les grosses plateformes type Twitter, Reddit, LinkedIn ? Personnellement, je souhaite toujours y publier, car je souhaite bénéficier de leur hébergement et de leur visibilité. Cependant, je n’ai pas envie que ces plateformes fassent ce qu’elles veulent de mon contenu sous prétexte que perdu dans leur T&C, il est mentionné “ton contenu est à nous, on fait ce qu’on veut avec”.

          C’est une question de choix : Parfois, je souhaite que mon contenu soit public et en clair. Parfois, je souhaite qu’il soit “redakté” car je n’ai pas envie qu’il soit indexé par les bots de Google ou utilisé pour entrainer les IA d’OpenAI.

          • Magnor@lemmy.magnor.ovh
            link
            fedilink
            Français
            arrow-up
            1
            ·
            1 year ago

            Typiquement sur ces grosses plateformes, peu de gens utiliseront ce type d’outil. Ton texte ne sera donc lisible que par une minorité. Tu ne bénéficie donc pas (ou peu) de leur visibilité.

            • touzovitch@jlai.luOP
              link
              fedilink
              Français
              arrow-up
              2
              ·
              1 year ago

              C’est LA grande question. Personnellement je suis plutôt optimiste et je pense sincèrement qu’il y a des use cases, mais ça reste à prouver.

    • touzovitch@jlai.luOP
      link
      fedilink
      Français
      arrow-up
      3
      ·
      edit-2
      1 year ago

      J’ai choisi AES car dans la v.2 je compte donner la possibilité à l’utilisateur de choisir de chiffrer son contenu avec une clé custom. Je n’aurais alors pas besoin de changer de modèle de chiffrement.

  • touzovitch@jlai.luOP
    link
    fedilink
    Français
    arrow-up
    2
    ·
    1 year ago

    r3d4kt-U2FsdGVkX1/ujB+aC6/SGTh/BpR7xUh6u4Rt0rO1vhIZILjg8G4PmcAD98Uo/T+FjI19f2bv2NgjS8BFHAjerZ9Om7sFehlLKW/cXI/CnMdXw/IBi/jAEJLtosmo8guzc/eHNNIDySwAl/c+Am7YLGO+NpdJGVw5bRbr3/KnmcY=&&&