2025-01-01から1年間の記事一覧
Malum-230は手作りの日本語の事前学習・事後学習両用の論理推論データセットです。素晴らしいデータセットなので、ファインチューニングを手軽にできるLLaMA-Factoryのお勉強の題材として使ってみました。有難いです。 人手で作成した、事前学習・事後学習両…
話題のGenesisをwsl2で動かしてみます。少しだけはまっちゃったのでメモしておきます。先人たちに感謝。 github.com 環境 wsl2(windows11): Distributor ID: UbuntuDescription: Ubuntu 22.04.5 LTSRelease: 22.04Codename: jammy 手順 とりあえず、仮想環境…
HuggingFaceから発表されたAgentを作成するツールであるSmolagents。1000行くらいのcodeで機能を提供しているとのこと。Colabで試せないかなと思ったらLiteLLMModelを利用できるとあるので、試してみました。 huggingface.co github.com ColabのL4環境でモデ…