Qwe3-VL-30B-A3Bにmarioを見せてみる。　#6

Qwen3-VL-30B-A3B-InstructはMarioのゲーム画面を記述させてみます。Colab A100 環境で行いました。VRAM占有率は、66935MiB / 81920MiB でした。 huggingface.co 公式のQuickstartにそって準備します。flash_attentionは有効化し実行しました。位置関係や状…

#VLM

2025-10-05

ibm-granite/granite-4.0-h-small-GGUFをollamaとcolabで試してみる。

LLM Colaboratory Python 自然言語処理お勉強

地味なところを攻めている印象のIBM。granite-4.0-h-smallのGUFFをお試ししてみます。ColabのL4環境で実行しました。VRAM占有率は19443MiB / 23034MiBでした。 huggingface.co すっかり進歩したSLMの中で、32Bの多言語対応モデルとして突出した印象はありま…

#LLM #IBM-GRANITE

2025-09-28

ColabでGEPAを参考にプロンプト最適化を考えてみる。

LLM Colab Python 自然言語処理お勉強

プロンプトを「Reflection（自然言語による自己反省）」と「Genetic-Pareto Optimization（進化的パレート最適化）」するという論文が紹介されてました。参考にしつつ、分かる部分範囲で試してみます。なお、論文の実装の検証目的ではありません。論文にはさ…

#LLM #PROMPT #Colab

2025-09-25

さくらのAI EngineをColabで試してみる。

Colab Python 自然言語処理 LLM

SAKURA internetではGPUがある？ということで、（個人で設置は厳しいですが）gpt-oss-120bやQwen, llm-jpのモデルを利用できるAPIのサービスを始めました。さっそく、設定して、Chat Completionを呼び出してみます。 www.sakura.ad.jp こちらのサイトに従っ…

#LLM

2025-09-18

ModernBERTのEmbedding APIサーバーをつくってみる。

BERT LLM Python

ModernBERTのembeddingモデルをAPI経由で利用できるように挑戦してみました。ollamaでは現在対応していないようだすし、複雑なプログラムにはならないだろうとチャレンジしてみます。ついでなのでrerankも組み入れてみます。利用しやすいようにOpenAI互換を…

#embedding #LLM

2025-09-11

K2-Think-ggufをollamaとColabで試してみる。

Colab LLM Python 自然言語処理

K2-Think-ggufをmmngaさんによるGUFF化されたモデルで試してみます。小型モデルで優秀とのこと。最近すっかり小型モデルが優秀でなので、びっくりする楽しみは減りましたが・・・。ColabのL4を利用します。VRAM占有率は20323MiB / 23034MiB でした。結果： …

#LLM #Colab #K2-Think

2025-08-30

VibeVoiceで日本語の音声生成をColabで試してみる。

Colab LLM Python 自然言語処理

Microsoft1がポッドキャストでの会話ような自然な会話音声を生成するモデルを公開しました。Colabを利用します。サンプルプログラムはT4用でVibeVoice-1.5Bですが、ColabのL4環境でより大きいVibeVoice-7B-Previewにもチャレンジしてみました。英語の会話は…

#VibeVoice #LLM

2025-08-23

gemma-3-270m-itをColabでfull_finetune #2

LLM Colab Python 自然言語処理

gemma-3-270m-itはコンパクトで、Googleさんからもfull_finetuneするコードが公開されています。〇〇風なチューニングではなく、QAセットで情報追加にチャレンジしてみます。ベースはGoogleさんが提供したColabノートを利用します。ColabのL4環境で実行しま…

2025-08-22

gemma-3-270m-itを自作データでColabでファインチューニングしてみる。

LLM Colaboratory Python 自然言語処理

Googleから公開されたGemma3 270M。FineTuringの方法も記載されています。そちらを利用してColabのL4環境で（雑な）自作データで学習をさせます。databricks-dolly-15kをローカルLLMでギャル語風に変換したデータです。 1h20mの学習時間でそれらしい出力が得…

#LLM #Gemma

2025-08-20

Sarashina-embedding-v2-1Bで類似検索をColabで試してみる

Colab LLM Python 自然言語処理

「日本語に特化した指示を付与できるテキスト埋め込みモデル」として、Sarashina-embedding-v2-1Bが公開されました。さっそく、Retrival用途で簡単に実装してみてお試ししてみます。ColabのL4環境でお試ししました。 huggingface.co このモデルでは、queryだ…

#LLM #sarashina

2025-08-17

メモ：いろんなRAGを試せるようにしてみる。

LLM RAG Python

目先を変えて色んなRAG方式による回答を試したいので、RAGお試しを作ってみることにしました。汎用的ではありませんが、新しい論文がでたらGemini CLIあたりを使って、追加実装できるような程度に設計用のドキュメントを用意して実装してみました。basicなRA…

#LLM #RAG

2025-08-15

gemma3(270M)をollamaとColabでためしてみる。

LLM Colab Python 自然言語処理

小型LLMの中でも、Googleのgemma3の超小型のLLMモデルを試します。ColabのT4環境です。ollama公式のgemma3:270mとUnsloth: 270m-itをColabのT4環境で試してみます。日本語のチューニングもされてないので、日本語怪しいかも・・・と思ったのですが、日本語…

#LLM

2025-08-11

OpenAI GPT-OSS 20Bをunslothを使ってColabでファインチューニングしてみる。

LLM Colab Python 自然言語処理

OpenAI GPT-OSS 20Bをunslothを使ってColabでファインチューニングに挑戦します。難しいチューニングは破綻の元なので、言葉じりを変える程度のチューニングを実施します。unslthの公式Colabを参考にして進めます。ColabのL4環境で実施します。データセット…

#LLM #unsloth #gptoss

2025-08-10

簡単なFastAPIを利用したMCP RAG Serverを作成してみる。

LLM MCP Python RAG 自然言語処理

Model Context Protocol (MCP)に準拠したRAG（Retrieval-Augmented Generation）機能を持つMCPサーバを機能を絞って簡単なものを作ってみます。ローカルで運用するのではなく、別サーバーで運用できるようにします。ここのところお気に入りのjules君と作業…

#自然言語処理 #MCP

2025-08-09

Colabとollamaでlangextractをためしてみます。

LLM Colab Python 自然言語処理

GoogleがOSSとして発表したlangextract。非構造化なテキストから構造化情報を得ることができます。structured outputとかでうまく収得することもできるので、敢えて必要なのかな・・・と思いつつ試してみました。Colabで試してみます。LLMは「Qwen3-4B-Instr…

#LLM #langextract

2025-08-06

gpt-oss:20bをollamaとColabで試してみる。

LLM Colab Python 自然言語処理

OpenAIのSLMであるgpt-oss:20bをColabのL4環境で試してみます。VRAM占有率は15207MiB / 23034MiB です。モデルはollama公式で提供されているgpt-oss-20bを利用します。楽しみです。今の時点では、このサイズ感でタスクに使いやすいのはQwenのモデルかも・・…

#LLM #自然言語 #gpt-oss

2025-07-31

qwen3:30b-a3b-instruct-2507-q4_K_MをColabとollamaでためしてみる。

LLM Colaboratory Python 自然言語処理

帰ってきたので、お試ししたかったqwen3:30b-a3b-instruct-2507-q4_K_Mを試してみます。モデルはollama公式に上がっているものを利用します。ColabのL4環境でためします。VRAM占有率は 18595MiB / 23034MiBでした。期待通りの性能でq4_K_Mでもいい感じです…

#LLM #ollama

2025-07-20

基本的なテキスト解析を振り返りつつ、LLMの解析を組み入れてみる。

Python LLM 自然言語処理お勉強

LLMになんでも頼りがちですが、基本的な言語解析はざっくり把握には大切です。数的なボリューム感を把握しておくというのは大事です。そこで、nlplot をよく利用させていただいていました。また、センチメント解析や分類タスクもLLMでは定番です。ローカルLL…

2025-07-06

メモ：Google julesのお題としてRAG戦略のテストができるものを作ってみた。

Python RAG LLM 自然言語処理お勉強

julesはGoogleのAIエージェントです。ベータテスト中のため、ごりごりお試しできそうだったので、RAGのお試し環境を構築してみます。以下の様な機能を持つようなお試し環境をかんがえました。 0. 簡単なUIでRAGをお試しできる。 1. User管理ができ、User別…

#LLM #RAG

2025-07-01

gemma3n:e4bをollamaとColabでためしてみる。

LLM Colaboratory Python 自然言語処理

gemma3n:e4bを試してみます。端末で動作させる前提なので、PCでもきっと活躍してくれるはずです。モデルはollamaの公式のものです。ColabのL4環境でお試しします。VRAM占有率は 7789MiB / 23034MiBなので、T4でも動作は出来ると思います。知識は豊富とは言…

#LLM

2025-06-25

mmnga/Llama-3.1-Swallow-8B-Instruct-v0.5-ggufをollamaとColabでためしてみる。

LLM Colaboratory Python 自然言語処理

Llama 3.1 8Bをベースにして日本語強化のバージョン強化をしたLlama-3.1-Swallow-8B-Instruct-v0.5が公開されていました。Swallowとは言え、8Bモデルです。ここまで小さいモデルでしかも量子化モデル。mmngaさん作のGUFFを利用します。ColabのL4環境で試しま…

#LLM

2025-06-23

unsloth/Mistral-Small-3.2-24B-Instruct-2506-GGUFをColabとollamaで試してみる

LLM Python Colaboratory 自然言語処理

Mistal-Small-3.2-24Bの2506バージョンを試してみます。2503バージョンよりも改善しているとのことです。2503は他の同クラスのものと比較して日本語で見る限りは見劣りをしていました。2506でどうか・・・気になります。ColabのL4環境で実行します。VRAM占有…

#LLM

2025-06-22

メモ：論文を見ながらRAGを実装してみる。RAG+: Enhancing Retrieval-Augmented Generation with Application-Aware Reasoning

RAG LLM 自然言語処理 Python

RAG+: Enhancing Retrieval-Augmented Generation with Application-Aware Reasoningという手法の論文が発表されていましたので試してみます。とにかく、動くところまで実装してみます。この方法のポイントは、RAGとして与えるコンテキストを、KnowledgeとAp…

#RAG #LLM

2025-06-14

メモ：RAGのハイブリッド検索を構築してみる

LLM RAG Python 自然言語処理

RAGのハイブリット検索を試してみます。ハイブリットということで複数の検索方法で検索した結果をRAGで利用するというものです。Langchainでは、multiple retrieversとして、EmsambleRetrieverを使った実装が紹介されています。 python.langchain.com ベクト…

#LLM

2025-06-12

bartowski/mistralai_Magistral-Small-2506-GGUFをollamaとColabでためしてみる。

LLM Colaboratory Python 自然言語処理

Mistral AIの小型モデルをollamaで試してみます。ColabのL4環境で試します。VRAM占有率は15525MiB / 23034MiBでした。日本語の出力もしっかりです。英語が混じりになることもわずかにありますが、GUFFファイル作成時に日本語チューニングがしっかりすれば減…

#自然言語処理 #LLM

2025-06-09

mmnga/Qwen3-EZO-8B-beta-ggufをColabとollamaでためしてみる。

LLM Colaboratory Python 自然言語処理

Qwen3ベースのEZO-8Bベータ版を試してみます。mmngaさんがGGUFに変換したモデルを利用してcolab L4環境で動作させました。 VRAM占有率は6545MiB / 23034MiBでした。これまでもEZOモデルはいい感じでベースモデルから性能を上げています。今回は、8Bでも高い…

#自然言語処理 #LLM

2025-06-01

ABEJA-Qwen2.5-32b-Japanese-v1.0をollamaとColabで試す。

LLM Colaboratory 自然言語処理

v1.0となったABEJA-Qwen2.5-32b-Japanese。v0.1の頃もいい感じだったので、期待してお試しします。mmngaさんの手によってGGUFとしたモデルを利用し、Colab L4環境でお試しします。21673MiB / 23034MiBのVRAM占有率でした。 32Bの量子化モデルであれば、実用…

#自然言語処理 #LLM

2025-05-25

メモ：RAGを実装してみる。理解、分解、再構築。

LLM Python RAG 自然言語処理

これまで、論文をヒントに幾つかのRAGを作成しました。折角なので、それらの機能を分解し、それぞれの機能を組み合わせてみます。今回もローカルLLMで挑戦です。ollamaで動作させたgemma3:4b-it-qatを利用します。4Bクラスとしては高い性能を有していますが…

#自然言語処理 #LLM #RAG

2025-05-21

メモ：Rag実装してみる。AgentRagだったんだけど・・・。

LLM Colaboratory Python RAG 自然言語処理

引き続き、RAG実装で遊んでみます。AgenticRagをChatGPTに読ませて骨子を確認したら、『「Retrieval → Evaluation → Query Refinement → 再検索 → Response Synthesis」という順序が、まさに論文中の処理パイプラインそのものになっています。各フェーズの出…

#LLM

2025-05-19

mmnga/Gemma-2-Llama-Swallow-27b-it-v0.1-ggufをColabとollamaで試す。

LLM Python Colaboratory 自然言語処理

Swallowの新しいモデルが公開されましたので、早速試してみます。mmngaさんがGUFFに変換したモデルを利用します。ColabのL4環境を利用します。VRAM占有率は19773MiB / 23034MiBでした。日本語は、さすがに自然です。比較的簡潔な文章を生成していました。基…

#LLM

地平線まで行ってくる。

記録あるいは忘備録。時には検討事項。

LLM

Qwe3-VL-30B-A3Bにmarioを見せてみる。　#6

ibm-granite/granite-4.0-h-small-GGUFをollamaとcolabで試してみる。

ColabでGEPAを参考にプロンプト最適化を考えてみる。

さくらのAI EngineをColabで試してみる。

ModernBERTのEmbedding APIサーバーをつくってみる。

K2-Think-ggufをollamaとColabで試してみる。

VibeVoiceで日本語の音声生成をColabで試してみる。

gemma-3-270m-itをColabでfull_finetune #2

gemma-3-270m-itを自作データでColabでファインチューニングしてみる。

Sarashina-embedding-v2-1Bで類似検索をColabで試してみる

メモ：いろんなRAGを試せるようにしてみる。

gemma3(270M)をollamaとColabでためしてみる。

OpenAI GPT-OSS 20Bをunslothを使ってColabでファインチューニングしてみる。

簡単なFastAPIを利用したMCP RAG Serverを作成してみる。

Colabとollamaでlangextractをためしてみます。

gpt-oss:20bをollamaとColabで試してみる。

qwen3:30b-a3b-instruct-2507-q4_K_MをColabとollamaでためしてみる。

基本的なテキスト解析を振り返りつつ、LLMの解析を組み入れてみる。

メモ：Google julesのお題としてRAG戦略のテストができるものを作ってみた。

gemma3n:e4bをollamaとColabでためしてみる。

mmnga/Llama-3.1-Swallow-8B-Instruct-v0.5-ggufをollamaとColabでためしてみる。

unsloth/Mistral-Small-3.2-24B-Instruct-2506-GGUFをColabとollamaで試してみる

メモ：論文を見ながらRAGを実装してみる。RAG+: Enhancing Retrieval-Augmented Generation with Application-Aware Reasoning

メモ：RAGのハイブリッド検索を構築してみる

bartowski/mistralai_Magistral-Small-2506-GGUFをollamaとColabでためしてみる。

mmnga/Qwen3-EZO-8B-beta-ggufをColabとollamaでためしてみる。

ABEJA-Qwen2.5-32b-Japanese-v1.0をollamaとColabで試す。

メモ：RAGを実装してみる。理解、分解、再構築。

メモ：Rag実装してみる。AgentRagだったんだけど・・・。

mmnga/Gemma-2-Llama-Swallow-27b-it-v0.1-ggufをColabとollamaで試す。