• dangrousperson@feddit.org
    link
    fedilink
    arrow-up
    7
    ·
    edit-2
    4 hours ago

    Offensichtlich hat Dienstag zwei t’s und nur Mittwoch hat keine

    Google AI kann es auch nicht

    edit: liegt wahrscheinlich daran, dass er einen Facebook Post als ‘Quelle’ gefunden hat wo es Middwoch heißt

  • macniel@feddit.org
    link
    fedilink
    arrow-up
    15
    ·
    5 hours ago

    Tja Schachmatt liebe Konservativen, euer Maschinengott hat ja zur 4 Tage Woche gesagt!

    • rbn@sopuli.xyz
      link
      fedilink
      arrow-up
      2
      ·
      5 hours ago

      Aber leider nur 3 einzelne freie Tage. Weniger zersplittert wäre mir lieber.

  • A_norny_mousse@piefed.zip
    link
    fedilink
    English
    arrow-up
    14
    ·
    7 hours ago

    😁

    Und dann kommen immer wieder Leute die uns erklären warum LLMs Schwierigkeiten mit sowas haben, als wenn das dadurch besser würde.

    • aaaaaaaaargh@feddit.org
      link
      fedilink
      arrow-up
      4
      ·
      5 hours ago

      Ist es definitiv. Wenn man weiß, wieso etwas nicht funktioniert, dann kann man es versuchen zu reparieren und das wird auch geschehen. KI nervt und ich hasse es, aber ich glaube, wir müssen uns damit leider abfinden.

    • Randelung@lemmy.world
      link
      fedilink
      arrow-up
      3
      ·
      5 hours ago

      Nein nein, du hast es nur falsch verwendet! Wenn du fünf weitere LLMs mit folgendem Satz als Workflow einstellst, sinkt die Chance eines Fehlers um 2%!

      Wie Artikel von Effizienz sprechen, ist mir schleierhaft. Du brauchst ein ganzes Team der Bullshitmaschinerie in der Hoffnung, einer davon produziert Shakespeare.

    • Jiral@lemmy.org
      link
      fedilink
      arrow-up
      1
      ·
      edit-2
      1 hour ago

      Welches Modell ist das?

      Ich habe es gerade mit Copilot probiert und da waren auch alle sieben, schön in Reihenfolge. Inkl. korrekter Internetquelle zu Wochentage auf Deutsch. Mich überrascht, dass da Claude Sonnet 4.6 soviel schlechter ist.

        • Jiral@lemmy.org
          link
          fedilink
          arrow-up
          1
          ·
          edit-2
          16 minutes ago

          Ich muss das mal lokal ausprobieren: Gemma4 31B, Qwen 3.6 27B und GPT-OSS 120B

          Es würde mich interessieren wie die im Vergleich zu Claude abschneiden.