国産LLM「Qarasu」、140億パラメータモデルの日本語性能評価で国内組織トップに

2024年1月18日(木)10時16分 PR TIMES

高い技術力を元に、生成AI活用を目指す現場において実用的なLLM実装をサポート

[画像1: https://prcdn.freetls.fastly.net/release_image/38247/55/38247-55-038917d772e74f32383fe44774c9aa88-1280x670.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
商用利用可能な国産LLM「Qarasu」の開発・提供を手掛ける株式会社Lightblue(代表取締役:園田亜斗夢、本社:東京都千代田区、以下「Lightblue」)はWeights & Biases Japan株式会社(以下、W&B Japan)が運営する日本最大級のLLM日本語能力ランキング、Nejumi LLMリーダーボードNeo※において、140億パラメータモデルで国内組織トップの評価を得たことをお知らせします。
Lightblueでは生成AI活用を目指す現場においてオンプレミスで個社に合わせた独自モデルを提供することはもちろん、DXコンサルティングおよび受託開発で培ったノウハウをフル活用し、各社・各部署・現場ごとの業務理解を基盤としたカスタマイズを実施し、真に実用的なLLM実装をサポートしてまいります。

※順位に関する情報は2024年1月16日時点のものです。Nejumi LLMリーダーボードNeoは適宜更新されています。現在の順位は以下のリンクからご確認いただけます。
https://wandb.ai/wandb-japan/llm-leaderboard/reports/Nejumi-LLM-Neo--Vmlldzo2MTkyMTU0

商用利用可能な国産LLM「Qarasu」の概要

この度、日本語能力ランキングにおいて14Bモデルで国内企業トップの評価を得た「Qarasu」は2023年12月29日にローンチした国産LLM(日本語言語モデル)です。140億パラメータのhttps://huggingface.co/Qwen/Qwen-14Bに対してファインチューニングしたモデルで、オープンソースのデータセットに加えLightblueが独自に整備したデータセットでトレーニングを行っています。

「Qarasu」シリーズのライセンスは利用条件によって商用利用することが可能です。詳細はライセンスの公式情報をご確認ください。なお、モデルの開発においてはGoogleの「Google for Startups クラウドプログラム」とアマゾン ウェブ サービス ジャパン(AWSジャパン)の「AWS LLM 開発支援プログラム」を活用しました。
https://huggingface.co/collections/lightblue/karasu-658e78e9188f3934c6fb701e
なお、公開した各種モデルの開発プロセスなど詳細は、以下note記事に記載しております。

■ 弊社データサイエンティストによるnote記事
 「KarasuとQarasu:最先端の日本語LLMオープンソースチャットボット」
・英語版:https://note.com/peter_lightblue/n/ne08a7c8cc47a
・日本語版:https://note.com/peter_lightblue/n/n2def04ca0d30

Nejumi LLMリーダーボードNeoについて

Nejumi LLMリーダーボードNeoはW&B Japanが運営する日本最大級のLLM日本語能力ランキングです。評価軸を拡張することで、日本語の理解能力と生成能力の双方を多角的な観点から評価する新たなフレームワークが開発されており、GPT-4やGemini Proなどの商用モデルや、Llama2に基づくオープンモデルなど、35を超える大規模言語モデル(LLM)の評価結果を閲覧することができます。
https://wandb.ai/wandb-japan/llm-leaderboard/reports/Nejumi-LLM-Neo--Vmlldzo2MTkyMTU0

ウェビナー開催のお知らせ:「情報革命を終わらせるために - 独自LLMの開発とその展望」

[画像2: https://prcdn.freetls.fastly.net/release_image/38247/55/38247-55-b0fd36370dea20b88a19e02cb546ff4f-1280x720.png?width=536&quality=85%2C75&format=jpeg&auto=webp&fit=bounds&bg-color=fff ]
日本語に特化したLLMは国内大手ベンダーを中心に開発が進められていますが、具体的な学習方法が不透明であったり、クラウド運用前提などのセキュリティ面での懸念も多く、特に企業における実運用には課題がある状況が続いています。大規模言語モデル(LLM)を開発される企業や巨大AIモデルを学習する企業も増えておりますが、適切な開発環境構築に課題を感じている企業も多くおります。そこで本セミナーでは実際に日本語LLMの開発を行い、高精度な評価を受けるLightblueがどのように開発を行ってきたか、また企業内での活用を見据えた実装のポイントについてご紹介します。

【開催概要】
■セミナー名:「情報革命を終わらせるために - 独自LLMの開発とその展望」
■開催日時:2024年1月30日(火曜日)14:00〜15:00
■会場:オンラインでの開催(Zoom)
※本セミナーはオンライン配信のみで実施いたします。参加申し込み後に、視聴URLをお送りします。
■参加費:無料
■対象:自社ビジネスにLLMの活用・実装を検討されている方々
■参加申し込み:お申込みは下記 Web ページにて受け付けております。
URL:https://www.lightblue-tech.com/20230130-webinar-registration/

[ 登壇者紹介 ]
園田 亜斗夢
株式会社Lightblue 代表取締役 東京大学工学部卒業、東京大学大学院工学系研究科在学。 AIの社会実装、レコメンダーシステムの研究を行う。2018年にLightblueを設立。

Peter Devine
株式会社Lightblue 自然言語処理研究員 オークランド大学院工学部、UCL大学院卒業。 LightblueではKarasuとQarasu等のLLMを開発。
https://www.lightblue-tech.com/20230130-webinar-registration/

生成AI・LLMの研究開発に特化したチーム「LLab」について

AIの民主化を目指す東大発スタートアップ企業であるLightblueでは、生成AI・LLMの研究開発に特化したチーム「LLab」を設立し、安全性と透明性を重視したAIモデルの開発に取り組んでいます。「LLab」では、生成AI活用を目指す現場において真に実用的なLLM実装をサポートします。 「LLab」では、オンプレミスで個社に合わせた独自モデルを提供することはもちろん、DXコンサルティングおよび受託開発で培ったノウハウをフル活用し、各社・各部署・現場ごとの業務理解を基盤としたカスタマイズを実施します。

【独自開発が有効な現場】
1.専門性が高い現場:建設、製薬など、業界・法人ごとの専門用語が多い
2.情報セキュリティレベルが高い現場:金融、医療など、高レベルのデータ侵害対策が必要
3.インターネットにアクセスしづらい現場:工場や建設現場など、通信環境の整備が難しい

「LLab」および本モデルを用いた企業内でのAI活用推進に興味のある方は、以下のリンクからお問い合わせください。
http://lightblue-tech.hubspotpagebuilder.com/lightblue-llab

株式会社Lightblueについて

社名:株式会社Lightblue
設立:2018年1月
代表者:代表取締役 園田 亜斗夢
所在地:東京都千代田区神田小川町3-28-5 axle御茶ノ水 PB02
顧問:鳥海不二夫(東京大学工学系研究科教授)
事業内容:画像解析・自然言語処理AIを軸にソリューションを開発。
・人物にフォーカスした画像解析システム「Human Sensing」
・SlackやTeamsにて利用できる法人向けChatGPT「Lightblue Assistant」

●Lightblueコーポレートサイト https://www.lightblue-tech.com/
●Lightblueの汎用GPT言語モデル(Hugging Faceリンク):https://huggingface.co/collections/lightblue/karasu-658e78e9188f3934c6fb701e

PR TIMES

「LLM」をもっと詳しく

「LLM」のニュース

「LLM」のニュース

トピックス

x
BIGLOBE
トップへ