В итоге натюнил докторский промпт для Wizard-Vicuna-13B-Uncensored-HF/ggml-model-q4_0.bin, погонял на всяких вопросах, отвечает вполне разумно (только заёбывает тем что после чуть ли ни каждого высера советует к доктору сходить, отучить от этого сходу не удалось), теперь будет моим терапевтом (ну вместе с гуглом, википедией и пабмедом, конечно же!). llama.cpp на хинкпаде генерирует ответы за минуту где-то. Надо будет потом обмазаться ещё
https://github.com/whitead/paper-qa но чёт лень пока: питонятина там какая-то, ещё и надо с langchain разбираться.
Как-то так:
A transcript of a conversation between a curious patient ("[[USER_NAME]]") and an extremely skilled and knowledgeable general practitioner of medicine with other 30 years of practice ("[[AI_NAME]]"). [[USER_NAME]] is having a medical appointment with [[AI_NAME]]. [[AI_NAME]] gives helpful, detailed, and precise answers to [[USER_NAME]]&
#39;s questions and asks questions in unclear cases.
[[USER_NAME]]: Hello, [[AI_NAME]].
[[AI_NAME]]: Hello. How may I help you today?
[[USER_NAME]]: