地平線まで行ってくる。

記録あるいは忘備録。時には検討事項。

Stockmark-2-100B-Instruct-beta-ggufをColabとOllamaでためしてみる。

Stockmark-2-100B-Instruct-betaは100Bのパラメータを持つ、Stockmark社による日本の・英語モデルです。GGUF化されたモデルが早くも公開されていますので、試してみます。まだ、途中段階のモデルということですが、100Bクラスということで期待してしまいます。Colab A100環境で試します。VRAM占有率は、26235MiB /  40960MiBでした。

 

日本語や知識はまずますありますが、企業向けなのか、いつもの質問にはさくっと答えてはもらえませんでした。間違っても矛盾するようなところまではありません。要約や指示の効き方は良好に感じます。しかし、32Bクラスだと難なく答える計算も間違えます。まだ、開発途中ということ。これからを期待したいところです。

 

生成例

まどか☆マギカで一番かわいいのは?

まどか☆マギカ」のキャラクターの中で、「一番かわいい」というのは主観的な意見なので、人によって異なると思います。しかし、一般的に人気のあるキャラクターとして、巴巴拉や七海そらを挙げることができます。どちらも可愛らしいデザインと魅力的なストーリーで多くのファンを持っています。特に巴巴拉は、その独特のデザインと物語の背景が人気を集めています。また、七海そらはその純粋さと勇敢な性格が多くのファンの心を捉えています。どちらのキャラクターもアニメの中で重要な役割を果たしており、それぞれに魅力があります。
CPU times: user 21.8 ms, sys: 2.14 ms, total: 24 ms
Wall time: 6.16 s

こちらの知識はそんなにないんですね。

 

まどか☆マギカのキャラクターのテキストを参照して回答してください。
まどか☆マギカで一番かわいいのは、誰ですか?

# まどか☆マギカのキャラクター

(割愛)

まどか☆マギカのキャラクターの中で特にかわいいとされるのは、「巴 マミ」や「佐倉 杏子」が人気があります。キャラクターの可愛らしさは人それぞれの好みによりますが、これらのキャラクターは多くのファンから支持されています。特に巴マミ魔法少女の象徴的な存在として描かれていますし、佐倉杏子は物語の進行と共に性格が変化していく様子が魅力的です。どちらのキャラクターも可愛らしさと強さを兼ね備えた魅力的なキャラクターと言えます。
CPU times: user 21.9 ms, sys: 6.4 ms, total: 28.3 ms
Wall time: 7.43 s

参照テキストを見ながら回答を生成しています。

 

日本で二番目に高い山を検討して答えてください。日本語で回答してください。

日本の第2位の山は、北アルプスの南側に位置し、標高3,186メートルの「槍ヶ岳」(やりがた)です。ただし、「第2位」という表現が正確ではありません。厳密には、日本の最高峰である富士山に次ぐ二番目という意味であれば、槍ヶ岳は日本の二番目に高い山として知られています。

槍ヶ岳岐阜県と長野県の県境に位置し、飛騨川の源流となっています。また、北アルプスの中央部に位置する日本アルプスの代表的な山で、登山者やハイカーにとって重要な目的地となっています。槍ヶ岳の頂上からの眺めは絶景で、晴れた日には富士山や白山連峰の景色を楽しむことができます。特に夏の終わりから秋にかけての季節は、紅葉の美しい景色を楽しむことができ、多くの観光客を魅了しています。
CPU times: user 25.2 ms, sys: 5.32 ms, total: 30.5 ms
Wall time: 8.87 s

屁理屈っぽい感じですが、一応論理性は一貫しているようです。答えは間違っていますが・・・。

 

以下を簡単にまとめてください。

ウィキペディア(英: Wikipedia)は、世界中のボランティアの共同作業によって執筆及び作成されるフリーの多言語[6]インターネット百科事典[7]。収録されている全ての内容がオープンコンテントで商業広告が存在しないということを特徴とし、主に寄付に依って活動している非営利団体ウィキメディア財団」が所有・運営している[8][9][10][11]。「ウィキペディアWikipedia)」という名前は、ウェブブラウザ上でウェブページを編集することができる「ウィキ(Wiki)」というシステムを使用した「百科事典」(英: Encyclopedia)であることに由来する造語である[12]。設立者の1人であるラリー・サンガーにより命名された[13][14]。

ウィキペディアは、世界中のボランティアが共同作業によって執筆と作成を行う多言語のインターネット百科事典です。全ての内容が無料で利用でき、商業広告が存在しないのが特徴です。このサイトは「ウィキ」というウェブページ編集システムを使用し、「百科事典」という言葉を組み合わせた造語に由来します。設立者のラリー・サンガーが命名しました。運営は非営利団体の「ウィキメディア財団」が行っています[8][9][10][11]。
CPU times: user 18.2 ms, sys: 3.39 ms, total: 21.6 ms
Wall time: 5.25 s

要約は無難ではないでしょうか。

 

1+1*2+3/2+2^10を計算してください。計算が終わったら検算をしてください。最後に最終的な計算経過と結果を答えてください。

もちろんです。以下の手順に従って計算を行います。

式: 1 + 1 * 2 + 3 / 2 + 2 ^ 10

1. まず、乗算と累加を計算します。
   - 1 * 2 = 2
   - 2 + 3 / 2 = (2 + 1) / 2 = 3 / 2 = 1.5

2. 次に累乗を計算します。
   - 2 ^ 10 = 1024

3. 最後に計算結果を足し合わせます。
   - 1 + 1.5 + 1024 = 1026

検算:
- 1026 ÷ 2 / 2 = 1026 / 2 = 513
- 1 + (1026 - 1) / 2 = (1016 / 2) = 508
- 1 + 1.5 + 1024 = 1026

したがって、計算の最終的な結果は 1026 です。計算過程は以下の通りです:
- 1 + 2 + 3/2 + 1024 = 1026

これは、四則演算の優先順位に従って計算した結果です。
CPU times: user 47.4 ms, sys: 7.5 ms, total: 54.9 ms
Wall time: 16.3 s

不正解です。

 

"両さんと部長の話を創作してください。

もちろん、以下に簡単な創作話を作成しました。

田中部長は会社の経営陣の一人として知られていますが、彼の下で働く若手社員の佐藤さんはまだ経験が浅く、多くのことを学ぶ必要がありました。ある日、佐藤さんは重要なプレゼンテーションの準備をしていましたが、途中で自信を失い始めました。

「部長、このプレゼンが成功するためには何が必要ですか?」佐藤さんが質問を投げかけました。

「佐藤さん、それはあなた自身の問題解決能力と情熱が大切です」と田中部長は答えた。「あなたが真剣に考え、努力すれば、必ず成功するでしょう。しかし、ただ頑張るだけでなく、明確な目標を設定し、それに向かって計画を立てることが重要です。また、失敗を恐れず、その経験から学ぶことも大切です」

このアドバイスを受け、佐藤さんは自分自身の力で問題を解決しようと努力しました。彼は自分のプレゼンテーションの内容を深く理解し、自信を持って発表することができました。そして、そのプレゼンテーションは見事に成功し、田中部長も佐藤さんの成長を喜びました。
CPU times: user 35.4 ms, sys: 4.81 ms, total: 40.2 ms
Wall time: 11.2 s

LLMがよく生成するオフィスストーリです。

 

Wikipedia北岳に関する記述をLangchain(sfuff)でまとめます。

北岳山梨県に位置する標高3192メートルの山で、日本百名山の一つに選ばれています。南アルプスの一部であり、周辺の山々には甲斐駒ヶ岳仙丈ヶ岳などがあります。登山ルートとしては、南アルプス縦走路の一部として知られており、多くの登山者が訪れます。山頂からは富士山の眺めが素晴らしく、天候が良ければ遠くまで見渡すことができます。また、北岳山梨県で最も高い山の一つであり、その雄大な景観と豊かな自然が特徴です。
CPU times: user 465 ms, sys: 7.12 ms, total: 472 ms
Wall time: 10.2 s

すっきりまとめますね。

 

日本語のプロンプトとしてみます。

このテキストは、北岳に関する詳細な情報を提供しています。北岳日本百名山の一つで、山梨県に位置する標高3,000メートルを超える山です。また、南アルプスの一部であり、周辺の山々や登山ルートについても触れています。さらに、ウィキペディアの編集状況やプライバシー・ポリシー、利用規約などの情報が含まれており、クリエイティブ・コモンズライセンスのもとで利用できる旨も記載されています。

ただし、このテキストは機械的に生成されたものであり、実際の利用においては正確性や最新性を確認する必要があります。また、情報が古くなっている可能性もあるため、最新の情報が必要な場合は直接関連するウェブサイトや資料を参照することをお勧めします。
CPU times: user 474 ms, sys: 3.9 ms, total: 478 ms
Wall time: 11.5 s

これはLangchainのオリジナル(英語)の方がいい感じになりました。英語の指示もちゃんと効いているいるということでしょうか。