Qwen1.5-MoE-A2.7B-Chat-GPTQ-Int4を試してみる。

AI Colaboratory Python お勉強自然言語処理

Qwenの新しいモデルQwen1.5-MoE-A2.7Bを試して見ました。少し期待しつつ・・・。モデルのページはこちら。 huggingface.co 質問：日本で２番目に高い山は？日本で2番目に高い山は富士山です。なかなか正解は難しい。質問：日本の観光地でおススメを教えて…

#自然言語処理

2024-03-25

RakutenAI-7B-instruct-q4_K_M_ggufを試して見る。

Colaboratory AI IT Python お勉強自然言語処理

RakutenAI-7Bはいい感じだったので、ggufで速度やお家GPUで活用できるのかも、と期待しつつおためし。instructモデルです。 Colab T4環境で動かしてみた。 gist.github.com 以下のやり取りで、Wall timeで2.78s。問い：日本の有名な観光地と名物は？詳しく…

#映画

2024-03-21

RakutenAI-7Bを試してみる。

AI Colaboratory IT LLM Python お勉強自然言語処理

楽天からもLLMモデルが発表された。日本語のモデルが沢山出てきてどんどんよくなるといいですね。 huggingface.co さっそく試して見ました。まどか☆マギカで一番かわいいのは？まどか☆マギカには、個性豊かなキャラクターがたくさんいます。人それぞれ好み…

#自然言語処理

2024-03-20

RWKV/HF_v5-Eagle-7Bを試してみる。

AI Colaboratory IT Python 自然言語処理

RWKVは、RNNとTransformerを組み合わせた推論が軽いという。継続して学習させているというので、時々チェックしていた。Eagle 7Bというモデルが出たので試してみる。翻訳性能も高くなっていて期待しつつ。 blog.rwkv.com というわけで、colabのメモリup＋GPU…

#自然言語処理

2024-03-16

Swallow-MS-7b-v0.1を試してみる。

Colaboratory AI IT Python お勉強自然言語処理機械学習

オープンなモデルでかつ一歩進んでいる感じのあるSwallow。MS-7Bは7Bとしては高い性能があるらしいということで試して見ます。 huggingface.co npakaさんの記事を見ながらColabで構築します。 note.com gist.github.com ColabのGPU T4で動かせるようなのでT4…

#自然言語処理