微软は静かに、ChatGPT をベースにしたシステムである Visual ChatGPT をリリースしました。これは、あなたが話すことを私が描くことで機能するシステムです。伝統的な(実際には存在しない)話すことを描くシステムである Stable Diffusion は既に広く知られていますが、今回の V ChatGPT とは何が違うのでしょうか?
この機会を利用して、私は ChatGPT ツールチェーンを使って ChatGPT ファミリーの新しいメンバーを解読することにしました。
ChatGPT ツールチェーンを利用するということで、次のルールを定める必要があります:この行から始まる以降、ツールの使用方法などの手順に関する説明以外のテキストはすべて ChatGPT ツールチェーンからのものです。まず、元の ChatGPT はネットワークにアクセスできず、データは 2021 年までしか持っていないため、Visual ChatGPT に関する情報はありません。したがって、関連情報を取得するためにツールを使用する必要があります。
幸運なことに、Visual ChatGPT の GitHub には論文が添付されており、詳細な説明がされています。それでは、ChatPDF というツールを使用して論文を読んでみましょう。
まず、Visual ChatGPT についての要約を教えてください。以下は生成された内容です:「Visual ChatGPT についての要約を教えてください」と尋ねます。
素晴らしい結果が得られましたが、英語がわからない人にはどうでしょうか?「中国語で要約してください」と伝えることができます。
もちろん、yetone が開発した openai-translator を使用することもできます。
しかし、英語と中国語のどちらもツイッターの文字制限を超えていますので、少し短くすることはできますか?はい、以下はその回答です:
Visual ChatGPT は、異なるビジョンベースのモデルを組み合わせたシステムであり、ユーザーが言語と画像を送受信して AI システムと対話することを可能にします。複雑なビジョンタスクをサポートし、ビジョン編集命令に複数の AI モデルが協力する必要があるタスクも扱えます。このシステムは、多くの実験でその理解力と生成力が検証されています。
もう少し複雑なものについて尋ねてみましょう:Visual ChatGPT と Stable Diffusion の違いは何ですか?
Visual ChatGPT のワークフローについて詳しく説明してください。
さらに、Visual ChatGPT の Prompt Manager について説明してください。
Visual ChatGPT の使用例を示してください。
Visual ChatGPT をインストールして使用する方法はどうすればよいですか?PDF には書かれていないので、関連情報は得られません。
以上が今回の内容です。自動化プロセスと組み合わせることで、ChatGPT は多くの技術やツール推奨の作業を置き換えることができることがわかります。
私の Twitter: