Когда появится казахский чат GPT, ответил глава Минцифры
По данным министра, госслужащие и граждане используют чат GPT, загружают разного рода информацию.
"Хочется, чтобы специфика нашей культуры и правильный перевод эти модели отражали (...). Собирается корпус казахского языка и слова в оригинале на казахском языке. Плюс через различные инструменты переводятся качественные тексты – с русского и английского языков. Это все вместе объединяется, токенизируется и на этой основе будет периодически тренироваться модель", – дополнил Жаслан Мадиев.
По его словам, от вычислительной мощности машин, на которых тренируется эта модель, зависит срок тренировки в целом этой модели в ее завершенном формате.
"По нашим оценкам, совместно с Назарбаев Университетом и НИТ-ом, к декабрю к декабрю возможно будет подготовить полноценно казахскую LNN-модель, на основе которой можно иметь казахский GPT. Я думаю, что для страны это очень важно", – сказал министр.
Он также отметил, что казахский GPT можно будет применять на других платформах, к примеру Яндекс и Google. По его мнению, все должно быть в открытом доступе и казахским GPT должны пользоваться все стартапы, компании и платформы.
Кроме того, у министра уточнили, в какую сумму обходится разработка отечественного аналога ChatGPT?
"Сейчас я не могу вам сумму назвать, потому что там есть часть спонсорских средств, то есть для кого не безразлична казахская языковая модель. Мы были этим удивлены, что есть спонсоры, которые готовы участвовать в этом большом проекте. И переживают за появление нашего Kaz LLM и ChatGPT, поэтому сейчас я не могу назвать, сколько государство на это тратит. Но в принципе – это те трудовые затраты и ресурсы, которое государство тратит в виде зарплат сотрудников. Это те инженеры, которые тренируются на этом, получают опыт", – ответил Жаслан Мадиев.
С его слов, эту модель еще надо поддерживать, потому что, как только она будет выпущена, то к ней будут одновременно обращаться до 10-50 тыс. пользователей.
19 февраля 2024 года стало известно, что в Казахстане разработали концепцию развития искусственного интеллекта на пять лет.