In a Training Loop 🔄

64 535

Behrooz Azarkhalili

ermiaazarkhalili

AI & ML interests

LLMs, VLMs, PEFT, RL for LLMs and VLMs.

Recent Activity

published a model about 2 hours ago

ermiaazarkhalili/Qwen3-0.6B-GRPO-NuminaMath-10K

liked a dataset 2 days ago

Jackrong/Qwen3.5-reasoning-700x

liked a dataset 2 days ago

nohurry/Opus-4.6-Reasoning-3000x-filtered

View all activity

Organizations

Collections 6

View 6 collections

models 44

datasets 6

ermiaazarkhalili/alpaca-gpt4-short-100tok

Viewer • Updated Dec 20, 2025 • 5k • 10

ermiaazarkhalili/orca-mini-short-100tok

Viewer • Updated Dec 20, 2025 • 5k • 7

ermiaazarkhalili/orca-mini-v1-high-prob-qwen-0.5b-10k

Viewer • Updated Dec 16, 2025 • 10k • 10

ermiaazarkhalili/alpaca-gpt4-en-high-prob-qwen-0.5b-10k

Viewer • Updated Dec 16, 2025 • 10k • 13

ermiaazarkhalili/alpaca-cleaned-high-prob-qwen-0.5b-10k

Viewer • Updated Dec 16, 2025 • 10k • 14

ermiaazarkhalili/alpaca-high-prob-qwen-0.5b-10k

Viewer • Updated Dec 16, 2025 • 10k • 9

Behrooz Azarkhalili

AI & ML interests

Recent Activity

Organizations

Collections 6

HuggingFaceH4/ultrachat_200k

teknium/OpenHermes-2.5

Open-Orca/OpenOrca

mlabonne/FineTome-100k

hewei2001/ReachQA

omoured/RefChartQA

AI-4-Everyone/Visual-TableQA

HuggingFaceM4/ChartQA

HuggingFaceH4/ultrachat_200k

teknium/OpenHermes-2.5

Open-Orca/OpenOrca

mlabonne/FineTome-100k

hewei2001/ReachQA

omoured/RefChartQA

AI-4-Everyone/Visual-TableQA

HuggingFaceM4/ChartQA

models 44

ermiaazarkhalili/Qwen3-0.6B-GRPO-NuminaMath-10K

ermiaazarkhalili/LFM2-700M-GRPO-NuminaMath-50K

ermiaazarkhalili/LFM2-350M-GRPO-NuminaMath-50K

ermiaazarkhalili/SmolLM2-135M-Instruct-GRPO-NuminaMath-50K

ermiaazarkhalili/SmolLM2-1.7B-Instruct-GRPO-NuminaMath-50K

ermiaazarkhalili/LFM2-2.6B-GRPO-NuminaMath-50K

ermiaazarkhalili/Qwen3-0.6B-GRPO-NuminaMath-100K

ermiaazarkhalili/Qwen2.5-0.5B-Instruct-GRPO-NuminaMath-100K

ermiaazarkhalili/Qwen3-0.6B-GRPO-NuminaMath-50K

ermiaazarkhalili/Qwen2.5-0.5B-Instruct-GRPO-NuminaMath-50K

datasets 6

ermiaazarkhalili/alpaca-gpt4-short-100tok

ermiaazarkhalili/orca-mini-short-100tok

ermiaazarkhalili/orca-mini-v1-high-prob-qwen-0.5b-10k

ermiaazarkhalili/alpaca-gpt4-en-high-prob-qwen-0.5b-10k

ermiaazarkhalili/alpaca-cleaned-high-prob-qwen-0.5b-10k

ermiaazarkhalili/alpaca-high-prob-qwen-0.5b-10k

Behrooz Azarkhalili

AI & ML interests

Recent Activity

Organizations

Collections 6

models 44 Sort: Recently updated

datasets 6 Sort: Recently updated

models 44

datasets 6