ChatGPT, Gemini, DeepSeek… која вештачка интелигенција греши најмногу?

Вештачките чет-ботови не се совршени и повремено можат да „халуцинираат“, т.е. да дадат неточни одговори – кој го предводи во тоа?

Големите јазични модели работат со препознавање на шеми и предвидување на следниот најверојатен збор во низа, а не со всушност „познавање“ на фактите.

Проблемот се јавува кога моделот не може да најде јасна шемa за одговорот, а сепак се обидува да конструира значаен текст врз основа на статистиката, што може да доведе до неточни информации.

Компанијата Legal Guardian Digital, која се занимава со SEO оптимизација за правни фирми, ја анализираше фреквенцијата на грешки на овие алатки, задоволството на корисниците и стабилноста на работата на различните чет-ботови.


Резултатите покажуваат дека Google Gemini има највисока стапка на неточни одговори, со дури 32% „халуцинации“. Следен е ChatGPT со приближно 30%, додека најточен е Perplexity AI, со околу 13% погрешни одговори. DeepSeek и Grok исто така бележат релативно ниски стапки на грешки од 14% и 15%.

Кога станува збор за целокупното корисничко искуство, DeepSeek и ChatGPT имаат највисоки оценки за задоволство од 4,7 (од максимум 5), додека Perplexity AI следи со 4,6.

Во конечниот ранг, кој ги вклучува сите фактори, Perplexity AI го зазема првото место со индекс од 85, по што следат Grok и DeepSeek. ChatGPT се најде на средината на листата со оценка од 50, додека Gemini постигна 41, а Meta AI го освои последното место со 37 поени.