In:
iCCC2026 - iCampus Cottbus Conference
Effekte der Quantisierung auf RAG Language Modelle für Parkinson
Patrick Gaudl , Christoph-Alexander Holst and Volker Lohweg,Large Language Models bieten großes Potenzial für assistive Anwendungen in der Parkinsonversorgung, sind jedoch aufgrund ihres hohen Speicherbedarfs bislang schwer in der Praxis einsetzbar. Dieser Beitrag untersucht den Einfluss verschiedener Quantisierungsmethoden auf ein Retrieval-Augmented-Generation-System auf Basis eines Qwen-Modells. Die Ergebnisse zeigen, dass sich der Speicherbedarf auf bis zu 36 % reduzieren lässt, bei leichter bis moderater Beeinträchtigung der Antwortqualität. Die Ergebnisse demonstrieren, dass lokal ausführbare Parkinson-Assistenzsysteme technisch realisierbar sind.
Literature procurement:
iCCC2026 - iCampus Cottbus Conference
Bibtex: Download Bibtex
@inproceedings{3282,
}
| author | = | {Gaudl, Patrick and Holst, Christoph-Alexander and Lohweg, Volker}, |
| title | = | {Effekte der Quantisierung auf RAG Language Modelle für Parkinson}, |
| booktitle | = | {iCCC2026 - iCampus Cottbus Conference}, |
| year | = | {2026}, |
| editor | = | {}, |
| volume | = | {}, |
| series | = | {}, |
| pages | = | {235-238}, |
| address | = | {Cottbus}, |
| month | = | {May}, |
| organisation | = | {}, |
| publisher | = | {}, |
| note | = | {}, |