- 生成AI
LLMとは?基礎知識をおさらい!|主要LLMサービスまとめ
さまざまな大規模言語モデル(LLM)が登場し、「どんなLLMがあるのかわからない」「名前は知っているけれど違いがわからない」などキャッチアップが追いついていない方も多いのではないでしょうか。
本記事では、日々公開され続けている大規模言語モデル(LLM)の一部をご紹介。オープンソースとクローズドソースの違いについても解説しています。
LLMについてあまり詳しくない方も、LLMについて普段から触れている方の復習にも役立つ記事になっていますので、ぜひ最後までご覧ください。
そもそもLLMとは?
本記事でも既に登場している「LLM」という単語。一体どのような意味をもっているのでしょうか。
LLMとは “Large Language Models” の頭文字を取った単語であり、日本語では「大規模言語モデル」というように呼称されています。現状「LLM」というとChatGPTをはじめとした「文章生成AI」を指しているというように考えても差し支えないのではないでしょうか。
確率モデルの一種である言語モデルですが、大規模言語モデルは「データ量」「計算量」「パラメータ数」の3要素を言語モデルと比較して大きく拡張したもののことを指しています。
「データ量」「計算量」「パラメータ数」の3要素を巨大化させ、構築されている大規模言語モデルは多くのデータなどから学習している分、より流暢で人間同士の会話に近い内容を出力することが可能になっています。
オープンソースとクローズドソースの違い
Meta社(旧Facebook社)が発表したLLMである「Llama」の登場をきっかけに、LLM領域におけるオープンソースであるかクローズドソースであるかの違いが注目されるようになりました。
オープンソースとは、LLMを動作させるために必要なソースコードが無償で公開されている状態のことを指しています。ソースコードが閲覧可能な状態であるため、そのLLMの注目度が高い場合、世界のエンジニア達によって自然に機能開発が進められていきます。日本でもオープンソースのLLMを活用し、日本語に特化させたLLMが公開されています。
一方、クローズドソースとは、先述のソースコードが非公開となっている状態のことを指しています。この状態ではソースコードを誰でも見ることができる状態ではないため、そのLLMの内部については開発元の企業の関係者しか知ることができません。
LLMソースコードの秘匿性を高くできる反面、オープンソースのようなメリットがないため、一長一短と言えるでしょう。ChatGPTやClaude、GeminiなどのLLMはクローズドソースです。
LLMの代表サービスまとめ
ここまでLLMの基本について解説してきましたが、代表的なLLMについてもご紹介します。世界的に有名かつ、性能も高いものばかりであるため、困ったらこちらで紹介しているLLMを利用するとよいでしょう。
ChatGPT
AIブームを牽引してきたChatGPT。アメリカのOpenAI社が開発・公開しているLLMであり、日本でも有名です。ChatGPTはクローズドソースであり、ソースを確認することはできません。
現状の最新モデルであるGPT-4では、画像認識やURLからホームページの情報を取得してくれるウェブブラウジング機能、アップロードしたファイルの情報を取得する機能などのマルチモーダル入力が可能です。画像生成AIであるDall E3やノーコードかつ個人でカスタマイズできるGPTsなど多くの機能が実装されています。旧モデルであるGPT-3.5よりも長い文章を入力することができ、回答の精度も非常に高くなっていると言えるでしょう。
また、2024年4月30日にMemory機能がPlusユーザー全員に開放されました。Memory機能は会話の内容やその中の情報をChatGPTが記憶してくれる機能です。これにより、チャットを始める前に毎度、詳細な設定を思い出させる必要がなくなるためユーザーの手間が減り、利便性が向上します。
現在では無料で利用できるFreeプラン、個人向け有償プランのPlus、企業、法人向けのTeam、Enterpriseプランが存在しており、個々の目的に合わせたプランで利用することが可能です。
利用に際して注意が必要な点は、入力した情報が再学習に利用される場合がある点です。Freeプランでは、入力した情報がLLMの再学習に利用されるため、情報漏洩の危険性があります。Team、Enterpriseプランではデータの再利用が行われることはないため機密情報を扱う場合には該当プランの導入を検討してください。
ChatGPTについてはこちらもご参考になれば幸いです。
Claude
2024年3月に最新モデルであるClaude3が公開され、注目が集まっているClaude。こちらはAnthropic社が開発したLLMです。ClaudeもChatGPTと同じくクローズドソースです。
Claude3がChatGPTと大きく異なる点は3つのモデルを切り替えて利用できる点です。最も高性能なOpus、生成速度に着目したHaiku、その中間モデルのSonnetの3つが展開されています。個人の目的に合わせて、モデルを切り替えることができる点はGPT-4にはない強みと言えるでしょう。
しかし、画像生成などの機能はないため、機能の豊富さでは一歩劣っています。ですが、ChatGPTよりも日本語が流暢であるとの声も多く、ChatGPTの良いライバルであると言えるでしょう。
無料で利用できるプランと、月額課金制ですべてのモデルにアクセス可能なClaude Proのプランがあり、選択可能です。無料版でもマルチモーダル入力を利用できる点はChatGPTにはないメリットと言えるでしょう。
Claude3についてはこちらもご参考になれば幸いです。
Llama
Meta社(旧Facebook社)が開発・公開しているLlama。最大の特徴はオープンソースである点でしょう。
オープンソースであることから、Llamaを利用したサービスやツールがこれからも公開され続けることが予想されます。また、最新版であるLlama3がGPT-4の性能を超えているとするベンチマークの結果もあり、オープンソースだからといって侮れない性能も兼ね備えています。
日本経済新聞社が過去40年分の記事を利用して独自LLMを構築したことがニュースとなり大きな注目を集めていましたが、このLLMもLlama2を利用して構築されています。
Llama3は現在日本で正式にはリリースされていないという点には注意が必要です。そのため、利用するためにはLlama3が活用されている別のチャットボット(Groq chatなど)を利用する必要があります。また、日本で正式リリースされていないため、日本語対応が十分でなく、日本語そのままで利用するのは少しハードルが高いと言えるでしょう。
Gemini
Google社が開発・公開しているGemini。もともとはBardという名前で提供されていました。Geminiもクローズドソースです。
ChatGPTとClaude3にはない、音声入力機能や読み上げ機能が実装されています。また、Googleが提供しているツールなだけあり、既に充実しているGoogleアプリの一部と連携することができます。そのため、LLM単体のデータだけでなく、アプリの機能を利用したうえで回答を生成してもらうことができます。
加えて、最大の特徴は情報のカットオフが明確に定義されていない点でしょう。多くのLLMでは取得したデータを学習するため、データのカットオフが特定のタイミングで行われており、カットオフ以降のデータは含まれていません。そのため、最新の情報については答えてくれないLLMが多いのですが、Geminiは最新の情報をもとに回答してくれます。
また、回答の最後に参考となりうるホームページをいくつかURLつきで提案してくれる場合もあり情報の補完に役立ちます。さすが世界で最も利用されている検索エンジンの提供元が開発したLLMといったところでしょうか。
Geminiは無料で利用できるプランに加えて、Gemini Advanced と呼ばれる月額課金プランの計2プランが展開されています。最新モデルはGemini Advancedのみで利用可能です。他のLLMサービスとは異なり、月額課金プランに2ヶ月間の無料トライアルがあるため、お試しで利用するのも良いでしょう。
いろいろなLLMをお試しできるAnakin.ai
さまざまなLLMをご紹介しましたが、どのLLMを魅力的に感じたでしょうか。今回紹介したLLMは無料でも十分利用できるものの、課金プランのみで提供されている最高性能モデルがやはり気になるところ。
そこで便利なプラットフォームがAnakin.aiです。
こちらのプラットフォームでは、無料で登録するだけで、GPT-4やClaude3 Opusなどの有料限定モデルにアクセスすることができます。
簡単に利用するLLMを切り替えることができ、ユーザビリティにも優れています。LLMだけではなく、他のAIツールについてもお試しすることができるためとてもおすすめです。
自分で同じ質問をして最も回答が優れていると感じたLLMを利用しましょう。
LLMを利用するときに気をつけたいこと
ここまでLLMについてご紹介してきましたが、利用するときに注意しなければならない点があります。
1.ハルシネーションに注意する
ハルシネーションとは、誤った情報をLLMが出力することを指します。AIの回答では、誤っている内容も正しい内容もまるで正しい情報かのように出力されてきます。そのため「AIは嘘をつく」というように表現されることが多いです。
ハルシネーションによって不利益を被らないためにも、AIが出力した内容について自身の知識が不足している場合には、鵜呑みにすることはしないようにしましょう。生成された回答を必ず確認する工程を挟むようにしてください。
回答の確認の工程が面倒な場合には、「〇〇について教えて」という使い方をしないというのも1つの手段です。「〇〇についてのアイデアを出して」「〇〇という行動にはどんな意図がありえますか」など、明確に正解がない問いに対してLLMの見解を問う、という使い方をすればハルシネーションの被害から逃れることができるでしょう。
2.情報流出の可能性がある
利用しているLLMやそのプランによっては、入力した情報がLLMの再学習に利用されます。そのため、入力した情報が流出してしまい、問題となる可能性があります。
個人情報や非公開の情報など、外部に流出してしまうと問題のある情報はむやみにLLMに入力しないようにしましょう。
まとめ
いかがだったでしょうか。
本記事ではLLMの基礎知識や主要LLMサービスをご紹介しました。
LLMを知るためには、自分の手で触ってみることが一番です。
本記事をご覧になった方もぜひご自分の手で一度LLMを動かしてみてください。
#LLM#大規模言語モデル#文章生成AI