GRPO Reddit Posts Summarization(LFM & Qwen) - a YuvrajSingh9886 Collection

YuvrajSingh9886 's Collections

jetson-nano-super-orin-benchmarks

GRPO Reddit Posts Summarization(LFM & Qwen)

smolcluster/ios-coreml-models

Quantized-models

SmolHub-ZeroSpaces

Fineweb Pretrained Models

TinyStories Pretrained Models

SportsOri-Fine-Tuned Models

GRPO Reddit Posts Summarization(LFM & Qwen)

updated 23 days ago

GRPO reward-signal ablation on LFM-2.5-350M & Qwen2.5-0.5B for 50-word Reddit summarization. Trained on Apple Silicon via smolcluster (MLX).

YuvrajSingh9886/grpo-summarization-reward-ablation

Summarization • Updated 23 days ago
YuvrajSingh9886/LFM2.5-350M-grpo-summarization-quality-meteor

Summarization • 0.4B • Updated 23 days ago • 126
YuvrajSingh9886/Qwen2.5-0.5B-grpo-summarization-quality-bleu-rouge

Summarization • 0.5B • Updated 23 days ago • 133
YuvrajSingh9886/reddit-posts-summarization-grpo

Viewer • Updated 23 days ago • 400 • 190 • 1