UlizaLlama ni modeli ya AI ya Kiswahili kutoka Jacaranda Health (Kenya), iliyoboreshwa kutoka Llama 2 ya Meta. ‼ Ni modeli ndogo ya utafiti — SI ‘ChatGPT ya Kiswahili’ na HAISHINDI modeli kubwa.

UlizaLlama ni nini?

Ni modeli ya lugha ya parameta bilioni 7, iliyoboreshwa kwa Kiswahili kwa kuongeza mamia ya mamilioni ya token za Kiswahili kwenye Llama 2. Imejengwa kwa matumizi ya afya na elimu, ina leseni isiyo ya kibiashara (CC BY-NC-SA).

Mfumo mpana wa AI wa Kiswahili

Hakuna ‘ChatGPT ya Kiswahili’. Kilichopo ni mfumo unaokua wa utafiti juu ya modeli huru za Magharibi (Llama, Gemma): UlizaLlama (Jacaranda Health, Kenya — Llama-2 ya parameta bilioni 7 iliyoboreshwa kwa Kiswahili, leseni isiyo ya kibiashara, kwa afya na elimu), AfroLlama (Llama-3 8B, lugha 5), InkubaLM (Lelapa AI, Afrika Kusini — modeli ndogo ya 0.4B), na Masakhane (jumuiya ya watafiti wa NLP wa Kiafrika pamoja na data huria). Hizi ni modeli ndogo za utafiti — si modeli kubwa za mstari wa mbele, na hazishindi GPT au Gemini kwa alama. Thamani yao ni uwazi, udhibiti wa ndani, kurekebishwa kwa sekta (afya/elimu), na kuendeshwa kwenye kifaa chako.

Ukweli muhimu

Kiswahili ni lugha yenye rasilimali chache kwa AI: modeli kubwa (ChatGPT, Gemini, Claude) zinaielewa, lakini si kwa kiwango cha Kiingereza. Katika kipimo cha IrokoBench, GPT-4o ilipata takriban 67% kwenye maswali ya maarifa (AfriMMLU) ya Kiswahili ikilinganishwa na alama za juu zaidi kwa Kiingereza; modeli huru kama Llama 3 70B ilipata karibu 45%. Kiswahili ndicho kinachohudumiwa vizuri kuliko lugha nyingi za Kiafrika, lakini bado kiko nyuma ya Kiingereza. Eleza kwa ukweli — si kwamba ‘inashinda modeli kubwa’, bali ni msaada wa kawaida ambao bado si kamili. UlizaLlama inazidi Llama-2 ya kawaida kwa Kiswahili, lakini haishindi modeli kubwa kama GPT au Gemini. Thamani yake ni uwazi, udhibiti wa ndani na matumizi ya sekta.

Pale unapohitaji zaidi ya chatbot tu, jukwaa kama osFoundry — jukwaa la AI ya wakala — husaidia kujenga suluhisho kuzunguka data na modeli zako (BYO); kwa kuwa msimbo wake unapatikana (source-available), unaweza kulisimika kwenye miundombinu yako mwenyewe (self-host).

Soma pia

Taarifa za jumla, si ushauri wa kitaalamu. Bei na vipengele hubadilika — daima hakiki kwenye ukurasa rasmi wa huduma.