tool 便利ツール

「3.5」から2年。「ChatGPT」軌跡から見る生成AIの現在地

2024/11/12 Tuesday
この記事をシェア: xシェア

生成AIの代名詞的存在として地位を確立したChatGPT。今やビジネスシーンはもちろん、日常生活にも一般的に使われることが増えています。大きな話題を呼んだ「ChatGPT-3.5」のリリースから約2年が経った今、その軌跡を振り返るとともに、類似サービスやビジネス利用の注意点を改めてまとめました。

5人に1人が使っているChatGPT

会話型の生成AIサービス「ChatGPT」。開発元は、イーロン・マスクやサム・アルトマンが2015年に設立した「OpenAI」で、今や生成AIの代名詞的存在として知られています。ローンチから複数回のアップデートを経て、人間との自然な会話やクリエイティブの生成などを高い精度でできるようになりました。

事務作業の自動化・効率化から、アイデアの壁打ち、プログラミング学習のリスキリングまで、さまざまな活用方法があります。本格導入している企業も多く、生産性の向上やコスト削減の面から生成AIを使いこなす重要性は年々高まっています。

野村総合研究所の調査(※1)によると、「ChatGPTを知っている」と答えた人は72.2%、「実際に利用したことがある」と答えた人は20.4%。いずれの質問も1年3ヶ月前の調査よりも比率は増加。利用用途は主に文章の作成や情報収集、要約、翻訳、アイデア出しなど。認知はすでに広まっていて、幅広い用途で使われていることがわかります。

※1出所:野村総合研究所「インサイトシグナル調査」2024年9月実施

もとを辿れば、2018年に生まれた「GPTシリーズ」。最初期から現在に至るまで、日進月歩で進化してきました。その軌跡を改めて整理します。

GPT は「大量の文章を読み込む」ことから始まった

OpenAIがGenerative Pre-trained Transformer(GPT)シリーズをつくったのは2018年のこと。最初にローンチされた「GPT-1」は、さまざまな書籍の文章を使って機械学習を行うことに成功しました。このとき使われたパラメータ数は1億1700万、データ量は4.5GBでした。

2019年に発表された「GPT-2」では、インターネット上に大量に存在するテキストデータを使って学習することで、汎用的な言語モデルを開発しました。使ったパラメータ数は15億、データ量は40GBと飛躍的に増加。より正確な文章を作り、長い会話を続けられるようになりました。

2020年には「GPT-3」が公開されました。1750億のパラメータ、570GBのデータと、GPT-2よりもはるかに大きなデータで学習したバージョンです。ある言葉に続く文章を予測させることで、より多くの文章を学習させました。これに伴ってこなせるタスクも増え、例えば翻訳や記事の作成、要約、質問への返答などができるようになりました。

2022年「3.5」をきっかけに大進化を遂げる

誰でも使えるチャット形式で爆発的に広まる

そして、2022年に「GPT-3.5」が公開。AIが学習して作り出す文章を、人間の価値観や感じ方に合わせて微調整(チューニング)できるようになりました。

同時にGPT-3.5を搭載した対話型生成AIサービス「ChatGPT-3.5」も登場しました。何より革新的だったのは、GPT-3.5の高い機能がチャット型のわかりやすい画面に搭載され、誰でもかんたんにAIとの会話を体験できるようになったことです。

実際、ユーザー数は公開後5日で100万人、2ヶ月で1億人を突破。世界中で話題を呼びました。2023年1月には米・MicrosoftがOpenAIに100億ドル規模の追加投資を行い、経済界からも注目を集めました。

画像や音声、動画も処理できる「マルチモーダル」へ

2023年に公開された「GPT-4」では、大幅な機能追加がありました。特に注目されたのは、テキストと画像のデータを組み合わせて処理できるようになった(マルチモーダルモデル)です。

これにより、さらに質が高く自然な会話をできるようになりました。米国の司法試験模試で上位10%に入る成績を出すなど、使い方によっては人間の能力を超えた成果を出せるまでになりました。

また、特定の目的や使い方に合わせてChatGPTをカスタマイズできる「GPTs」という機能も追加されました。ユーザーが自分の使い方や好みに合わせてChatGPTをカスタマイズしたチャットボットをつくれる画期的な機能です。

そして2024年、現在の最新版である「GPT-4o」がリリースされました。テキストはもちろん音声や画像、動画などを混合で処理し、さらに複数の形式で出力できるようになりました。時間あたりの利用回数などに制限がありますが、無料版でも使用可能。扱うデータ量も格段に増え、出力の高速化と精度も向上しました。

類似サービスも続々登場

ChatGPTのほかにも、会話型の生成AIサービスは複数出ています。例えば、Gemini(旧Bard、提供元:Google)や、Bing AI(同:Microsoft)、Perplexity AI(同:Perplexity AI)などがその代表例です。

2023年10月に日本で公開されたClaude(クロード)も有力です。Claudeは、OpenAIの元社員が独立して2021年に創業したスタートアップ・Anthropicが提供するサービスです。GPT-3から派生した「InstructGPT」をベースとしており、人間が書く文章に近い自然な表現でアウトプットするのが特徴です。また、単語だけでなく文脈を理解して適切な回答をするなどコミュニケーション能力にも優れていると言われています。

2024年3月に発表された最新版の「Claude 3」には、能力が高い順に「Opus」「Sonnet」「Haiku」の3モデルがあります。「Opus」や「Sonnet」を使う場合は、有償版の「Claude Pro」に加入する必要があるので、自分の使い方に過不足ないモデルを選びましょう。

生成AIを使う際の注意点3つ

便利な生成AIですが、使う際には注意点もあります。主なものを3つご紹介します。

1つ目は、正確性の担保です。ChatGPTは、問いに対して不確実な情報や誤報、古いデータをもとに回答してしまう「ハルシネーションリスク」があります。特にビジネス利用の際には、事実誤認を避け、意識して正確性を保つ必要があるでしょう。そのためには、組織で共通の利用ルールを敷く、情報元を辿り正確性を確かめるなどの工夫が必要です。

2つ目は、セキュリティの確保です。社外秘の情報や高度な個人情報などを入力すると、データ漏洩や個人情報の誤用などのリスクがあります。「GPT-4」以降は、テキストだけでなく画像や音声も処理できるようになっているため、アップロードして良い資料の範囲や利用用途などを線引きする必要があるでしょう。

3つ目は、AI依存を引き起こしてユーザーの思考力を下げてしまうリスクです。AIは業務効率化や自動化につながる一方で、依存させたり思考力を下げたりしてしまうという見方もあります。

ただし、指示(プロンプト)をおこなうのはあくまで人間です。どんな質問を投げれば質のいい回答が返ってくるか、その答えが自分の求めている条件を満たしているか、正確性に問題はないか、などの思考や判断は必要になるため、一概に思考力が低下するとは限らないとも言えます。

ビジネスにも使える精度になった生成AI。生成AIには、それぞれの特徴やメリット、得意分野があります。有料版・無料版の機能差もそれぞれ。ビジネス活用を考えるときは、自社に最適なものを選ぶほか、日本語対応の有無や機能の範囲などを含めて確認するのが第一歩になるでしょう。

『Alternative Work』では、定期的にメルマガを配信中!ニュース、時事ネタから仕事のヒントが見つかる情報まで幅広くお届けします。ぜひ、ご登録ください。

登録はこちら

この記事をシェア: xシェア

さくら もえMOE SAKURA

出版社の広告ディレクターとして働きながら、パラレルキャリアとしてWeb媒体の編集・記事のライティングを手掛ける。主なテーマは「働き方、キャリア、ライフスタイル、ジェンダー」。趣味はJリーグ観戦と美術館めぐり。仙台の街と人、「男はつらいよ」シリーズが大好き。ずんだもちときりたんぽをこよなく愛する。