In:
iCCC2026 - iCampµs Cottbus Conference, AMA Association for Sensors and Measurement
Effekte der Quantisierung auf Retrieval-Augmented-Generation Language Modelle für die Parkinson-Versorgung
Patrick Gaudl , Christoph-Alexander Holst und Volker Lohweg,Large Language Models bieten großes Potenzial für assistive Anwendungen in der Parkinsonversorgung, sind jedoch aufgrund ihres hohen Speicherbedarfs bislang schwer in der Praxis einsetzbar. Dieser Beitrag untersucht den Einfluss verschiedener Quantisierungsmethoden auf ein Retrieval-Augmented-Generation-System auf Basis eines Qwen-Modells. Die Ergebnisse zeigen, dass sich der Speicherbedarf auf bis zu 36 % reduzieren lässt, bei leichter bis moderater Beein-trächtigung der Antwortqualität. Die Ergebnisse demonstrieren, dass lokal ausführbare Parkinson-Assistenzsysteme technisch realisierbar sind.
Literatur Beschaffung:
iCCC2026 - iCampµs Cottbus Conference, AMA Association for Sensors and Measurement
Bibtex: Download Bibtex
@inproceedings{3191,
}
| author | = | {Gaudl, Patrick and Holst, Christoph-Alexander and Lohweg, Volker}, |
| title | = | {Effekte der Quantisierung auf Retrieval-Augmented-Generation Language Modelle für die Parkinson-Versorgung}, |
| booktitle | = | {iCCC2026 - iCampµs Cottbus Conference}, |
| year | = | {2026}, |
| editor | = | {}, |
| volume | = | {}, |
| series | = | {}, |
| pages | = | {0}, |
| address | = | {Cottbus, Germany}, |
| month | = | {May}, |
| organisation | = | {}, |
| publisher | = | {AMA Association for Sensors and Measurement}, |
| note | = | {}, |