Episode 154 - Sind LLMs auf Benchmark Daten manipuliert?

Knowledge Science - Alles über KI, ML und NLP

Kandungan disediakan oleh Sigurd Schacht, Carsten Lanquillon, Sigurd Schacht, and Carsten Lanquillon. Semua kandungan podcast termasuk episod, grafik dan perihalan podcast dimuat naik dan disediakan terus oleh Sigurd Schacht, Carsten Lanquillon, Sigurd Schacht, and Carsten Lanquillon atau rakan kongsi platform podcast mereka. Jika anda percaya seseorang menggunakan karya berhak cipta anda tanpa kebenaran anda, anda boleh mengikuti proses yang digariskan di sini https://ms.player.fm/legal.

8M ago 36:40

MP3•Laman utama episod

Send us a text

In der heutigen Sendung versuchen wir rauszufinden, ob man sich auf die öffentlichen Benchmarks zum Testen und Vergleichen von Sprachmodellen verlassen kann. Oder ob Benchmark Testdaten zum Trainieren verwendet werden. Hierbei handelt es sich um das Benchmark Leakage. Hören Sie rein.
Wir sprechen vor allem über das Paper: Benchmarking Benchmark Leakage in Large Language Models https://arxiv.org/abs/2404.18824

Support the show

208 episod

#Technologie #Bildung #Sigurd Schacht, Carsten Lanquillon #Carsten Lanquillon #Sigurd Schacht #Wissenschaft #Künstliche Intelligenz

Episode 154 - Sind LLMs auf Benchmark Daten manipuliert?

Knowledge Science - Alles über KI, ML und NLP

14 subscribers

published 8M ago

Kongsi

MP3•Laman utama episod

Send us a text

Support the show

208 episod

#Technologie #Bildung #Sigurd Schacht, Carsten Lanquillon #Carsten Lanquillon #Sigurd Schacht #Wissenschaft #Künstliche Intelligenz

Tutti gli episodi

Selamat datang ke Player FM

Player FM mengimbas laman-laman web bagi podcast berkualiti tinggi untuk anda nikmati sekarang. Ia merupakan aplikasi podcast terbaik dan berfungsi untuk Android, iPhone, dan web. Daftar untuk melaraskan langganan merentasi peranti.

Dengarkan lebih 500+ topik

Sama dengan Knowledge Science - Alles über KI, ML und NLP

Podcast Berbaloi untuk Didengar

Knowledge Science - Alles über KI, ML und NLP « » Episode 154 - Sind LLMs auf Benchmark Daten manipuliert?

Episode 154 - Sind LLMs auf Benchmark Daten manipuliert?

Podcast Berbaloi untuk Didengar

Selamat datang ke Player FM

Sama dengan Knowledge Science - Alles über KI, ML und NLP

Panduan Rujukan Pantas

Knowledge Science - Alles über KI, ML und NLP « »
Episode 154 - Sind LLMs auf Benchmark Daten manipuliert?