🤗
AI نىڭ GitHub سۇپىسى

Hugging Face — ئۇيغۇرچە يىلنامە

ئوچۇق كودلۇق AI مودېل، سانلىق مەلۇمات توپلىمى ۋە ML قوراللىرىنىڭ دۇنيادىكى ئەڭ چوڭ سۇپىسى

900K+مودېل
200K+سانلىق مەلۇمات
300K+Spaces
2016قۇرۇلغان يىل

Hugging Face دېگەن نېمە؟

ئوچۇق كودلۇق AI سۇپىسى — كىچىك سىتارتاپتىن چوڭ كارخانىغىچە ئىشلىتىدۇ

🏠

AI نىڭ GitHub ئامبىرى

Hugging Face — AI مودېل، سانلىق مەلۇمات توپلىمى ۋە مىلىيونلارچە تەتقىقاتچى، مۇھەندىس يەر ئالالايدىغان، ئوچۇق كودلۇق AI سۇپىسى. GitHub قانداق كودقا خىزمەت قىلسا، Hugging Face ئاشۇنداق AI غا خىزمەت قىلىدۇ.

🚀

Transformers كۈتۈپخانىسى

Hugging Face نىڭ `transformers` كۈتۈپخانىسى PyTorch، TensorFlow ۋە JAX نى قوللايدۇ. BERT، GPT-2، T5، LLaMA، Mistral قاتارلىق ئەڭ مەشھۇر مودېللەر شۇ ئارقىلىق ئاسان يوللانىدۇ.

💰

باھا مودېلى

ئاساسلىق مۇلازىمەتلەر تولۇق ھەقسىز. Pro ھېساباتى $9/ئاي، Enterprise $20/ئاي. Spaces GPU ئىجارىسى سائەتكە ھەسابلىنىدۇ. Inference API ئورتاق ئىشلىتىش ھەقسىز.

🌍

جامائەت كۈچى

5 مىليوندىن ئارتۇق ئىشلەتكۈچى بولۇپ، Google، Meta، Microsoft، Amazon قاتارلىق ئىرىم شىركەتلەر مودېل ۋە قورالىنى Hugging Face تا ئوچۇقلايدۇ.

Spaces — ئاپپ يايدۇرۇش

Gradio ياكى Streamlit ئارقىلىق ML ئاپپلىكاتسىيىسىنى بىر نەچچە مىنۇتتا ئەتراپقا يايدۇرۇش مۇمكىن. ھەقسىز CPU Spaces مەۋجۇت، GPU كىرايىسى تۆلەملىك.

🔬

تەتقىقات ئوچۇقلۇقى

ArXiv دىكى يىڭى تەتقىقات ئىشلىرىنىڭ 90% ي Hugging Face تا مودېل ۋە كودى بىلەن بىللە ئوچۇقلىنىدۇ. AI دۇنياسىدا ئوچۇق تەتقىقاتنىڭ مەركىزى.

📦

ئاساسلىق كۈتۈپخانىلار — Core Libraries

Python ئارقىلىق ئىشلىتىلىدىغان رەسمىي Hugging Face كۈتۈپخانىلىرى

12 كۈتۈپخانە
كۈتۈپخانە ئىسمىئۇيغۇرچە ئىسمىتەپسىلاتىتۈرى
🤗 transformersئۆزگەرتكۈچلەرNLP، CV، Audio ئۈچۈن 200,000+ ئالدىن تەربىيىلەنگەن مودېلنى يوللاش. PyTorch/TF/JAX قوللانغان.ئەڭ مەشھۇر
🤗 datasetsسانلىق مەلۇمات توپلىمى200,000+ سانلىق مەلۇمات توپلىمىنى بىر قۇر كود بىلەن يوللاش. Apache Arrow ئاساسلىق، يۇقىرى ئىقتىدارلىق.ئەڭ مەشھۇر
🤗 diffusersتارقىتىش مودېلىStable Diffusion، SDXL، DALL-E قاتارلىق رەسىم ۋە ۋىدىيو ھاسىللاش مودېللىرى ئۈچۈن.ئەڭ مەشھۇر
🤗 tokenizersتىلغا پارچىلىغۇچRust تا يېزىلغان، يۇقىرى ئىقتىدارلىق tokenizer. BPE، WordPiece، SentencePiece قاتارلىق ئۇسۇللار.مەشھۇر
🤗 accelerateتەربىيە تېزلەتكۈچىGPU، TPU، Multi-GPU، مەۋزۇن يادروسىز تەربىيىلىشنى ئاددىي كود بىلەن ئىشلىتىش.مەشھۇر
🤗 PEFTئازسانلىق تەربىيەLoRA، QLoRA، Prefix Tuning قاتارلىق كىچىك مىقداردا تەربىيىلەش ئۇسۇللىرى. LLM fine-tuning ئۈچۈن.مەشھۇر
🤗 TRLكۈچەيتىش ئۆگىنىشRLHF، DPO، PPO ئارقىلىق LLM نى ئىنسان ياقتۇرۇشىغا ماسلاشتۇرۇش (SFT, ORPO قاتارلىق).يېڭى
🤗 evaluateمودېل باھالاشBLEU، ROUGE، Accuracy، F1 قاتارلىق 100+ باھالاش ئۆلچىمى. ML مودېلىنى ئۆلچەش ئۈچۈن.ئاددىي
🤗 hub (huggingface_hub)ئامبار API كۈتۈپخانىسىHugging Face Hub تا مودېل يوللاش، چۈشۈرۈش ۋە باشقۇرۇش ئۈچۈن رەسمىي Python API.مەشھۇر
🤗 safetensorsبىخەتەر تەنسورPickle دىن بىخەتەر مودېل ئاغىرلىق ساقلاش ئۇسۇلى. تېز، ئاددىي، زىيانسىز.يېڭى
🤗 GradioAI ئاپپ قۇرغۇچىML مودېلى ئۈچۈن ئاددىي Python كودى ئارقىلىق تور ئارايۈزى قۇرۇش. Spaces بىلەن تولۇق بىرلەشكەن.ئەڭ مەشھۇر
🤗 optimumمودېل ئەلالاشتۇرۇشONNX، OpenVINO، TensorRT ئارقىلىق مودېلنى تېزلىتىش ۋە ئۆلچىمىنى كىچىكلىتىش.كارخانا
🔧

Pipeline ۋەزىپىلىرى — Tasks

transformers.pipeline() ئارقىلىق بىر قۇر كودتا ئىشلىتىلىدىغان AI ۋەزىپىلىرى

28 ۋەزىپە
📝
text-classification
تېكىست تۈرلەش
💬
text-generation
تېكىست ھاسىللاش
🔤
fill-mask
بوشلۇق تولدۇرۇش
question-answering
سوئال جاۋاپلاش
📋
summarization
خۇلاسىلاش
🌐
translation
تىل تەرجىمىسى
🏷️
token-classification
تامغا تۈرلەش (NER)
🔗
text2text-generation
تېكىست-تېكىست
🔍
zero-shot-classification
نۆل-ئۇرۇپ تۈرلەش
🧬
feature-extraction
ئالاھىدىلىك چىقىرىش
🖼️
image-classification
رەسىم تۈرلەش
🔲
object-detection
ئوبيېكت بايقاش
✂️
image-segmentation
رەسىم بۆلۈش
🎨
image-to-image
رەسىم-رەسىم
✏️
image-to-text
رەسىم-تېكىست
🖌️
text-to-image
تېكىست-رەسىم
🎭
depth-estimation
چوڭقۇرلۇق بايقاش
🎯
visual-question-answering
كۆرۈنۈش سوئالى
🎙️
automatic-speech-recognition
ئاۋاز تونۇش (ASR)
🔊
text-to-audio
تېكىست-ئاۋاز (TTS)
🎵
audio-classification
ئاۋاز تۈرلەش
🎤
audio-to-audio
ئاۋاز-ئاۋاز
🤝
document-question-answering
ھۆججەت سوئالى
🧩
mask-generation
قەلىپ ھاسىللاش (SAM)
🎬
text-to-video
تېكىست-ۋىدىيو
🔢
table-question-answering
جەدۋەل سوئالى
🧠
sentence-similarity
جۈملە ئوخشاشلىقى
🤖
conversational
سۆھبەت ئىنتېرپىرىتاتورى
🏆

مەشھۇر مودېللار — Popular Models

Hugging Face Hub تا ئەڭ كۆپ چۈشۈرۈلگەن ۋە ئىشلىتىلگەن AI مودېللىرى

20 مودېل
NLP
meta-llama/Llama-3.1
Meta نىڭ ئوچۇق كودلۇق چوڭ تىل مودېلى. 8B, 70B, 405B دەرىجىلىرى بار.
↓ 50M+ چۈشۈرۈش/ئاي
NLP
mistralai/Mistral-7B
يۇقىرى ئىقتىدارلىق 7B مودېل. Sliding Window Attention ئىشلىتىدۇ.
↓ 30M+ چۈشۈرۈش/ئاي
NLP
google/gemma-2
Google نىڭ ئوچۇق كودلۇق Gemma مودېلى. 2B, 9B, 27B.
↓ 20M+ چۈشۈرۈش/ئاي
NLP
microsoft/phi-3
Microsoft نىڭ كىچىك ئەمما كۈچلۈك مودېلى. 3.8B ئۆلچىمىدە.
↓ 15M+ چۈشۈرۈش/ئاي
NLP
Qwen/Qwen2.5
Alibaba نىڭ كۆپ تىللىق مودېلى. 0.5B دىن 72B غىچە.
↓ 25M+ چۈشۈرۈش/ئاي
CV
stabilityai/stable-diffusion-xl
يۇقىرى سۈپەتلىك رەسىم ھاسىللاش. SDXL ئەڭ مەشھۇر رەسىم مودېلى.
↓ 40M+ چۈشۈرۈش/ئاي
CV
openai/clip-vit-large
رەسىم ۋە تېكىستنى بىرلەشتۈرۈپ چۈشىنىدىغان CLIP مودېلى.
↓ 18M+ چۈشۈرۈش/ئاي
CV
facebook/sam-vit-huge
Meta نىڭ «Segment Anything Model» — رەسىمدىن ھەرنەرسىنى بۆلىدۇ.
↓ 10M+ چۈشۈرۈش/ئاي
Audio
openai/whisper-large-v3
OpenAI نىڭ ئاۋاز تونۇش مودېلى. 100+ تىل، يۇقىرى توغرىلىق.
↓ 35M+ چۈشۈرۈش/ئاي
Audio
suno/bark
يۇقىرى سۈپەتلىك TTS مودېلى. كۈلكە، ئەخلاق قاتارلىقنى تەقلىد قىلالايدۇ.
↓ 8M+ چۈشۈرۈش/ئاي
NLP
sentence-transformers/all-MiniLM
جۈملە Embedding ئۈچۈن ئەڭ مەشھۇر مودېل. RAG سىستېمىسى ئۈچۈن ئاساس.
↓ 45M+ چۈشۈرۈش/ئاي
NLP
google-bert/bert-base
2018-يىلدا چىققان تارىخىي BERT مودېلى. تۆۋەنكى ئاقىمدا تەربىيىلەشكە ئاساس.
↓ 22M+ چۈشۈرۈش/ئاي
Code
bigcode/starcoder2
كود ھاسىللاش ئۈچۈن ئالاھىدە تەربىيىلەنگەن 15B مودېل. 600+ پروگرام تىلى.
↓ 12M+ چۈشۈرۈش/ئاي
Code
Qwen/Qwen2.5-Coder
Alibaba نىڭ كود مودېلى. GPT-4o سىناق ئۆلچىمىدە ناھايىتى يۇقىرى نومۇر.
↓ 14M+ چۈشۈرۈش/ئاي
Multimodal
llava-hf/llava-1.5
رەسىم ۋە تېكىست ئىككىسىنى چۈشىنىدىغان كۆپ مۇھىتلىق مودېل.
↓ 9M+ چۈشۈرۈش/ئاي
Multimodal
Qwen/Qwen2-VL
رەسىم، ۋىدىيو ۋە تېكىستنى بىرلىكتە چۈشىنىدىغان يۇقىرى ئىقتىدارلىق مودېل.
↓ 11M+ چۈشۈرۈش/ئاي
NLP
deepseek-ai/DeepSeek-V3
DeepSeek نىڭ ئوچۇق كودلۇق 671B MoE مودېلى. ھەقسىز ئىشلىتىش مۇمكىن.
↓ 28M+ چۈشۈرۈش/ئاي
CV
black-forest-labs/FLUX.1
ئەڭ يۇقىرى سۈپەتلىك رەسىم ھاسىللاش مودېلى. SD نىڭ ئالماشتۇرغۇچىسى.
↓ 20M+ چۈشۈرۈش/ئاي
NLP
facebook/bart-large-cnn
مەتىن خۇلاسىلىمىسى (summarization) ئۈچۈن ئەڭ مەشھۇر BART مودېلى.
↓ 16M+ چۈشۈرۈش/ئاي
Audio
facebook/mms-300m
Meta نىڭ 1000+ تىلنى قوللايدىغان كۆپ تىللىق ئاۋاز مودېلى (MMS).
↓ 5M+ چۈشۈرۈش/ئاي
🏗️

سۇپا ئىقتىدارلىرى — Platform Features

Hugging Face Hub ۋە سۇپا مۇلازىمەتلىرى

14 مۇلازىمەت
مۇلازىمەت ئىسمىئۇيغۇرچە ئىسمىتەپسىلاتىتۈرى
🤗 Hub (Model Hub)مودېل ئامبىرى900,000+ ئالدىن تەربىيىلەنگەن مودېلنى ئاممىۋى ياكى خۇسۇسىي شەكىلدە ساقلاش ۋە ئورتاقلىشىش.ھەقسىز
🌌 Spacesئاپپ يايدۇرۇش سۇپىسىGradio ياكى Streamlit ئارقىلىق ML ئاپپنى بىر نەچچە مىنۇتتا ئەتراپقا چىقىرىش. CPU ھەقسىز.ھەقسىز/تۆلەملىك
📊 Datasets Hubسانلىق مەلۇمات ئامبىرى200,000+ سانلىق مەلۇمات توپلىمىنى بايقاش، كۆرۈش ۋە ئورتاقلىشىش سۇپىسى.ھەقسىز
⚡ Inference APIمودېل ئىجرا APIھەر قانداق مودېلنى API ئارقىلىق بىۋاسىتە سىناق قىلالايسىز. ئورتاق ئىشلىتىش ھەقسىز.ھەقسىز
🔒 Inference Endpointsخۇسۇسىي API مۇلازىمىتىئۆز مودېلىڭىزنى خۇسۇسىي، مىقياسلانغان API ئارقىلىق يايدۇرۇش. AWS/Azure/GCP تاللانمىسى.تۆلەملىك
🏢 Organizationsتەشكىلات ھېسابىتىتىم شەكلىدە مودېل، Spaces، سانلىق مەلۇماتلارنى باشقۇرۇش. Google، Meta، Microsoft قاتارلىقلار ئىشلىتىدۇ.ھەقسىز
🔐 Private Hubخۇسۇسىي ئامباركارخانا ئىچىدە خۇسۇسىي Hugging Face Hub. ئاخىرقى بىخەتەرلىك ۋە مەخپىيەت تاللانمىسى.كارخانا
🖥️ AutoTrainئاپتوماتىك تەربىيەكوددىن باشقا ئۇسۇلدا مودېل fine-tuning ئۈچۈن. سانلىق مەلۇماتنى يۈكلەپ ئاپپلىكاتسىيە تاللاسىلا بولىدۇ.تۆلەملىك
📈 Model Cardsمودېل ئۇچۇر بىتىمودېل توغرىسىدا مەزمۇن، ئىشلىتىش، تەربىيە ئۇچۇرى ۋە ئەخلاق تەھلىلى يازما بىتى.ھەقسىز
🏅 Leaderboardsمودېل رەتلىك تاختىسىMMLU، HumanEval، MT-Bench قاتارلىق ئۆلچەملەر بويىچە مودېل رەتلىمىسى.ھەقسىز
🔬 Papersتەتقىقات ماقالىلىرىArXiv تەتقىقات ماقالىلىرى بىلەن مۇناسىۋەتلىك مودېل ۋە كودنى باغلاش سۇپىسى.ھەقسىز
🎓 Hugging Face Courseھەقسىز ئوقۇش ماتېرىيالىNLP، Diffusers، RL قاتارلىق تېمىلاردا تولۇق ھەقسىز ML كۇرسلىرى.ھەقسىز
💬 Discussionsمۇزاكىرە سۇپىسىھەر مودېل ياكى سانلىق مەلۇمات توپلىمىدا ئامما مۇزاكىرىسى ئېچىش ۋە سوئال سوراش.ھەقسىز
🔗 ZeroGPU / Free GPUھەقسىز GPU SpacesSpaces دا كۆپ ئىشلىتىلىدىغان مودېللار ئۈچۈن ئورتاق GPU ئىجارىسى (A100). Pro ئابونتلارغا مۇقىم GPU.يېڭى
🏢

كارخانا مۇلازىمەتلىرى — Enterprise

AWS، Azure، GCP بىلەن بىرلەشتۈرۈلگەن كارخانا دەرىجىلىك مۇلازىمەتلەر

6 مۇلازىمەت
مۇلازىمەت ئىسمىئۇيغۇرچە ئىسمىتەپسىلاتىتۈرى
AWS SageMaker + HFAWS بىرلەشمىسىHugging Face مودېللىرىنى AWS SageMaker تا بىۋاسىتە تەربىيىلەش ۋە يايدۇرۇش.AWS
Azure ML + HFAzure بىرلەشمىسىHugging Face مودېللىرىنى Azure Machine Learning تا ئىشلىتىش ۋە يايدۇرۇش.Azure
Google Cloud + HFGCP بىرلەشمىسىVertex AI تا Hugging Face مودېللىرىنى يايدۇرۇش. TPU تەربىيىسى مەۋجۇت.GCP
HF Hub Enterpriseخۇسۇسىي كارخانا ھۇبىSSO، SAML، ئۆلچەملىك بىخەتەرلىك، ئاۋدىت تىزىمى بار كارخانا دەرىجىلىك ھۇب.كارخانا
Inference Endpoints (Dedicated)خۇسۇسىي API مۇلازىمىتىئۆز مودېلىڭىزنى خۇسۇسىي GPU تا يايدۇرۇش. AWS/Azure/GCP مىنتاقىسىنى تاللالايسىز.كارخانا
Expert Supportمۇتەخەسسىس ياردىمىHugging Face مۇتەخەسسىسلىرىدىن بىۋاسىتە تېخنىك ياردەم ۋە ML مەسلىھەت خىزمىتى.كارخانا
📅

Hugging Face تارىخى يىلنامىسى

چاتبوت سىتارتاپتىن دۇنيانىڭ ئەڭ چوڭ AI سۇپىسىغا

2016
يەڭگۈچى چاتبوت ئاپپ سىتارتاپى سۈپىتىدە قۇرۇلدى
2019
transformers كۈتۈپخانىسى ئوچۇقلاندى — تارىخ ئۆزگەردى
2021
400M دوللارلىق باھالاش بىلەن Series C مولىيە ئالدى
2022
4.5 مىلياردلىق باھالاش — AWS، Google، NVIDIA سالمىدا ئالدى
2023
🚀
500,000+ مودېل، Llama 2 ئوچۇقلىنىپ ئىنقىلاب يۈز بەردى
2024
900,000+ مودېل، ZeroGPU ۋە LeRobot رومبوتىق AI دەۋرى