Accelerating LLMs with TornadoVM: From GPU Kernels to Model Inference

airhacks.fm podcast with adam bien

Java Prog Languages Es 6 Es 7 Css 3 Webstandards Adam Bien Airhacks Tech Webcomponents MicroProfile Jakarta EE Serverless Cloud IT JavaScript

Kandungan disediakan oleh Adam Bien. Semua kandungan podcast termasuk episod, grafik dan perihalan podcast dimuat naik dan disediakan terus oleh Adam Bien atau rakan kongsi platform podcast mereka. Jika anda percaya seseorang menggunakan karya berhak cipta anda tanpa kebenaran anda, anda boleh mengikuti proses yang digariskan di sini https://ms.player.fm/legal.

7M ago 1:11:04

MP3•Laman utama episod

An airhacks.fm conversation with Juan Fumero (@snatverk) about:

tornadovm as a Java parallel framework for accelerating data parallelization on GPUs and other hardware, first GPU experiences with ELSA Winner and Voodoo cards, explanation of TornadoVM as a plugin to existing JDKs that uses Graal as a library, TornadoVM's programming model with @parallel and @reduce annotations for parallelizable code, introduction of kernel API for lower-level GPU programming, TornadoVM's ability to dynamically reconfigure and select the best hardware for workloads, implementation of LLM inference acceleration with TornadoVM, challenges in accelerating Llama models on GPUs, introduction of tensor types in TornadoVM to support FP8 and FP16 operations, shared buffer capabilities for GPU memory management, comparison of Java Vector API performance versus GPU acceleration, discussion of model quantization as a potential use case for TornadoVM, exploration of Deep Java Library (DJL) and its ND array implementation, potential standardization of tensor types in Java, integration possibilities with Project Babylon and its Code Reflection capabilities, TornadoVM's execution plans and task graphs for defining accelerated workloads, ability to run on multiple GPUs with different backends simultaneously, potential enterprise applications for LLMs in Java including model distillation for domain-specific models, discussion of Foreign Function & Memory API integration in TornadoVM, performance comparison between different GPU backends like OpenCL and CUDA, collaboration with Intel Level Zero oneAPI and integrated graphics support, future plans for RISC-V support in TornadoVM

Juan Fumero on twitter: @snatverk

376 episod

#Java #Prog Languages #Es 6 #Es 7 #Css 3 #Webstandards #Adam Bien #Airhacks #Tech #Webcomponents #MicroProfile #Jakarta EE #Serverless #Cloud IT #JavaScript

Accelerating LLMs with TornadoVM: From GPU Kernels to Model Inference

airhacks.fm podcast with adam bien

202 subscribers

published 7M ago

Kongsi

MP3•Laman utama episod

An airhacks.fm conversation with Juan Fumero (@snatverk) about:

tornadovm as a Java parallel framework for accelerating data parallelization on GPUs and other hardware, first GPU experiences with ELSA Winner and Voodoo cards, explanation of TornadoVM as a plugin to existing JDKs that uses Graal as a library, TornadoVM's programming model with @parallel and @reduce annotations for parallelizable code, introduction of kernel API for lower-level GPU programming, TornadoVM's ability to dynamically reconfigure and select the best hardware for workloads, implementation of LLM inference acceleration with TornadoVM, challenges in accelerating Llama models on GPUs, introduction of tensor types in TornadoVM to support FP8 and FP16 operations, shared buffer capabilities for GPU memory management, comparison of Java Vector API performance versus GPU acceleration, discussion of model quantization as a potential use case for TornadoVM, exploration of Deep Java Library (DJL) and its ND array implementation, potential standardization of tensor types in Java, integration possibilities with Project Babylon and its Code Reflection capabilities, TornadoVM's execution plans and task graphs for defining accelerated workloads, ability to run on multiple GPUs with different backends simultaneously, potential enterprise applications for LLMs in Java including model distillation for domain-specific models, discussion of Foreign Function & Memory API integration in TornadoVM, performance comparison between different GPU backends like OpenCL and CUDA, collaboration with Intel Level Zero oneAPI and integrated graphics support, future plans for RISC-V support in TornadoVM

Juan Fumero on twitter: @snatverk

376 episod

#Java #Prog Languages #Es 6 #Es 7 #Css 3 #Webstandards #Adam Bien #Airhacks #Tech #Webcomponents #MicroProfile #Jakarta EE #Serverless #Cloud IT #JavaScript

Semua episod

Selamat datang ke Player FM

Player FM mengimbas laman-laman web bagi podcast berkualiti tinggi untuk anda nikmati sekarang. Ia merupakan aplikasi podcast terbaik dan berfungsi untuk Android, iPhone, dan web. Daftar untuk melaraskan langganan merentasi peranti.

Dengarkan lebih 500+ topik

Sama dengan airhacks.fm podcast with adam bien

Podcast Berbaloi untuk Didengar

airhacks.fm podcast with adam bien « » Accelerating LLMs with TornadoVM: From GPU Kernels to Model Inference

Accelerating LLMs with TornadoVM: From GPU Kernels to Model Inference

Podcast Berbaloi untuk Didengar

Selamat datang ke Player FM

Sama dengan airhacks.fm podcast with adam bien

Panduan Rujukan Pantas

airhacks.fm podcast with adam bien « »
Accelerating LLMs with TornadoVM: From GPU Kernels to Model Inference