AXCXEPT_llm-jp-3-3.7b-instruct-EZO-HumanitiesをColabで試してみる。

llm-jp/llm-jp-3-3.7b-instructとしたチューニングを施したllm-jp-3-3.7b-instruct-EZO-Humanitiesを試してみました。ColabのT4環境でVRAMぎりぎりで動作しました。日本語や日本関係の基礎知識は3.7bと思えないほどありそうな印象でした。ながながと文章を生…

#自然言語処理

2024-09-28

llm-jp-3-1.8b-instruct-Q4_K_MをollamaとColabでうごかしてみる。

AI Colaboratory LLM Python 自然言語処理

あるふ(@alfredplpl)さんが、早速、量子化バージョンを作成しアップロードされていたので、ありがたくお試しします。1.8Bです。せっかくなので、ローカルランタイムに接続して走らせてみました。RTX 3060(12GB)で、VRAMの占有も小さく(3767MiB)、コンパクト…

#自然言語処理

2024-09-28

Llama-3.2-1B-Instructを少しだけファインチューニングしてColabでためす。

Colaboratory AI IT LLM 自然言語処理

Llama-3.2が発表されました。LLMLlama-3.2-1B-Instructは小型のモデルでローカルで気軽に動作できそうです。ファインチューニングして遊んでみます。本格的なチューニングは専門家にお任せするとして、どんな感じなんだろう・・・と動かすのが狙いです。ロー…

#自然言語処理

2024-09-26

llm-jp-3-1-8b-instructを少しだけファインチューニングしてColabでためす。

Colaboratory LLM AI Python 自然言語処理

1.8Bでもなかなか良いのではないかと評判のLLM-jpをColabでチャレンジしました。浅い学習レベルですが、ファインチューニングして使ってみましたのでメモします。 llmc.nii.ac.jp ファインチューニングのパラメータは、特に最適化なぞ考えず、決め打ちです。…

#自然言語処理

2024-09-25

LoRAでモデルを作ったので複数のモデルを同時にColabでためしてみる

Colaboratory AI LLM Python 自然言語処理

ローカルLLMだといろんなモデルを同時に動かすのは大変だ。最近、（いまさら）LoRAで遊んでいたので、LoRAのモデルを切り替えることで複数のモデルを使い分ければ、プロンプトだけで悩まずに利用の幅が広がる。また、ゲームのNPCなんかだったら、いろんなキ…

#自然言語処理

2024-09-23

ArXivから論文を参照してLLMをColabでファインチューニングしてみる。

LLMをファインチューニングするためのデータセットをLLM準備をしたところ、結構使えそうな印象がありました。面白いので、もう少しほかのデータで試したくなりました。 bwgift.hatenadiary.jp 前提データセットの利用データセットの対象対象の論文を読み…

#自然言語処理

2024-09-21

Qwen2.5-7B-Instruct-GGUFをColabでためしてみる。

Colaboratory AI お勉強自然言語処理

Qwen2.5が発表されていました。Qwen2もよかったので順調に進化しているのでしょう。 huggingface.co すでに多くの方がためしていらっしゃるようですが、自分でやります。7bモデルをColabのT4環境でためします。楽しみです。GGUFモデルは、今現在ollamaでは推…

#自然言語処理

2024-09-16

LLM用のデータセットを作ってみる

Colaboratory IT AI Python 自然言語処理

ローカルでも稼働できる軽量で人にやさしい印象のある日本語得意なモデルが出てきています。最近ではTanukiが開発されたことは、とても印象深いです。今でも、OpenAIやGoogleのモデルを使って数を処理するのは、コスト的に大変で一般人のお小遣いレベルでは…

2024-09-14

Colabをローカル環境と接続する。

Colaboratory Python

試行錯誤ができる便利なColab。しかも、サブスクリプションで私ごときでは買えない環境を気軽に使える。でも、いつもいつもだらだらと使っていると使い切ってしまう。そこで、自分のPC環境でColabを接続をして使うこともできるという言い訳でミドルエンドPC*…

2024-09-11

RWKV-x060-Jpn-7BもColabで試してみる。

Colaboratory AI Python LLM 自然言語処理

RWKV-6-Worldを試していたら、日本語版あるよ、とレスポンスいただいたので早速ためしてみます。 There are Japanese-tuned models in https://t.co/RrJ6RQWmxn And check https://t.co/7Ug0gvrMq1 — BlinkDL (@BlinkDL_AI) 2024年9月10日モデルはこちらで…

#自然言語処理