// MULTIMODAL · NATIVE · EFFICIENT

Google Gemini

گۈگىلنىڭ يېڭى نەسىل AI مودېل ئائىلىسى

Gemini بولسا Google DeepMind تەرىپىدىن قۇرۇلغان multimodal AI مودېل ئائىلىسى. تېكىست، رەسىم، ۋىدىيو ۋە كودنى native ھالدا چۈشىنىدۇ. Ultra، Pro ۋە Flash ۋارىيانتلىرى بار. بۇ ماقالىدە Gemini نىڭ قابىلىيەتلىرى، API ئىشلىتىش ۋە ئەمەلىي قوللىنىشلىرى بار.

01 — Gemini نېمە 02 — مودېللار 03 — Multimodal 04 — API 05 — Vertex AI 06 — ئىشلىتىش 07 — مۇقايىسە
gemini-models
U
Gemini Ultra
ئەڭ كۈچلۈك، مۇرەككەپ مەسىلىلەر
P
Gemini Pro
تەڭپۇڭلۇق، كۆپ خىل ۋەزىپە
F
Gemini Flash
تېز، ئۈنۈملۈك، ئارزان
Text + Image + Video + Audio + Code = Multimodal Native
01
Gemini دېگەن نېمە؟
What Is Google Gemini?
Google DeepMind نىڭ يېڭى نەسىل multimodal AI مودېلى
Gemini — Google DeepMind تەرىپىدىن 2023-يىلى دېكابىردا ئېلان قىلىنغان AI مودېل ئائىلىسى. ئەڭ چوڭ ئالاھىدىلىكى شۇكى، ئۇ باشتىنلا multimodal قىلىپ قۇرۇلغان — تېكىست، رەسىم، ۋىدىيو، ئاۋاز ۋە كودنى بىرلىكتە native ھالدا بىر تەرەپ قىلالايدۇ. ئىلگىرىكى مودېللاردەك ئايرىم-ئايرىم encoder نى بىرىكتۈرگەن ئەمەس.
ئىلگىرىكى يول
تېكىست ۋە رەسىم ئايرىم model
encoder لارنى بىرىكتۈرۈش
modality ئارىسىدا gap
Gemini يولى
باشتىنلا multimodal
native understanding
seamless reasoning
ئەۋزەللىكى
cross-modal reasoning
1M+ token context
code generation
02
Gemini مودېل ئائىلىسى
Model Family
Ultra، Pro، Flash ۋە Nano — ھەر ئىشقا ماس مودېل
مودېلئالاھىدىلىكىContextماس ئىشلار
Gemini 2.0 Ultraئەڭ كۈچلۈك2M tokensresearch، complex reasoning
Gemini 2.0 Proتەڭپۇڭ2M tokensgeneral purpose، coding
Gemini 2.0 Flashتېز ۋە ئارزان1M tokenschat، summarization
Gemini Nanoon-device32K tokensmobile، edge
Ultra
Most Capable
ئەڭ كۈچلۈك
مۇرەككەپ reasoning، ئىلمىي تەھلىل، كۆپ قەدەملىك مەسىلە ھەل قىلىش. Gemini Advanced دا ئىشلىتىلىدۇ.
Pro
Balanced
تەڭپۇڭلۇق
كۈندىلىك ۋەزىپىلەر ئۈچۈن ماس. سۈپەت بىلەن سۈرئەت ئوتتۇرىسىدا ياخشى تەڭپۇڭلۇق.
Flash
Fast & Efficient
تېز ۋە ئۈنۈملۈك
يۇقىرى throughput، ئاز latency، تۆۋەن باھا. كۆپ چىقىم چاقىرىش لازىم بولغاندا ئەۋزەل.
Nano
On-Device
ئۈسكۈنىدە
Pixel تېلېفونلىرىدا ئىجرا بولىدۇ. تور باغلىنىشى تەلەپ قىلمايدۇ، شەخسىيەت ساقلىنىدۇ.
03
Multimodal قابىلىيەت
Native Multimodal Capabilities
تېكىست، رەسىم، ۋىدىيو ۋە ئاۋازنى بىرلىكتە چۈشىنىش
Gemini نىڭ ئەڭ كۈچلۈك تەرىپى multimodal native بولۇشى. رەسىم ھەققىدە سوئال قويۇڭ، ۋىدىيودىن خۇلاسە چىقىرىڭ، diagram دىن كود يازدۇرۇڭ — ھەممىسى بىر API چاقىرىشتا.
Vision
Image Understanding
رەسىم چۈشىنىش
رەسىمدىكى ئوبيېكت، تېكىست، دىئاگرامما ۋە ئىحساسنى تونۇش. OCR، chart analysis، scene understanding.
Video
Video Analysis
ۋىدىيو تەھلىلى
ۋىدىيونى باشتىن ئاخىرىغىچە چۈشىنىش. سەھنە، ھەرىكەت، سۆز ۋە مەزمۇننى بايان قىلىش.
Audio
Audio Processing
ئاۋاز بىر تەرەپ قىلىش
native audio understanding. سۆزنى تونۇش، ئاۋاز ئاھاڭىنى پەرقلەندۈرۈش، musika تەھلىلى.
Code
Code Generation
كود ھاسىل قىلىش
كۆپ خىل پروگرامما تىلىدا كود يېزىش، چۈشەندۈرۈش، debugging ۋە optimization.
PYTHONmultimodal_example.py
import google.generativeai as genai
from PIL import Image

# API ئاچقۇچىنى تەڭشەش
genai.configure(api_key="YOUR_API_KEY")

# مودېلنى قۇرۇش
model = genai.GenerativeModel("gemini-2.0-flash")

# رەسىم بىلەن سوئال
image = Image.open("diagram.png")
response = model.generate_content([
    "بۇ diagram نى چۈشەندۈرۈپ، Python كودىغا ئايلاندۇر",
    image
])

print(response.text)
04
Gemini API ئىشلىتىش
Using the Gemini API
Google AI Studio ۋە Python SDK
BASHterminal
# SDK ئورنىتىش
pip install google-generativeai

# API key نى environment variable قىلىپ تەڭشەش
export GOOGLE_API_KEY="your-api-key"
PYTHONchat_example.py
import google.generativeai as genai

genai.configure(api_key=os.environ["GOOGLE_API_KEY"])

model = genai.GenerativeModel("gemini-2.0-flash")

# ئاددىي سۆھبەت
response = model.generate_content("Python دا list comprehension نى چۈشەندۈر")
print(response.text)

# سۆھبەت تارىخى بىلەن
chat = model.start_chat(history=[])
response = chat.send_message("سالام، ماڭا Python ئۆگەت")
print(response.text)

response = chat.send_message("decorator نېمە؟")
print(response.text)

تەڭشەك تاللانمىلىرى

PYTHONconfig.py
generation_config = {
    "temperature": 0.7,       # 0-2، يۇقىرى = تەخەييۇل كۆپ
    "top_p": 0.95,             # nucleus sampling
    "top_k": 40,               # top-k sampling
    "max_output_tokens": 8192, # ئەڭ كۆپ چىقىرىش
}

safety_settings = [
    {"category": "HARM_CATEGORY_HARASSMENT", "threshold": "BLOCK_MEDIUM_AND_ABOVE"},
    {"category": "HARM_CATEGORY_HATE_SPEECH", "threshold": "BLOCK_MEDIUM_AND_ABOVE"},
]

model = genai.GenerativeModel(
    "gemini-2.0-pro",
    generation_config=generation_config,
    safety_settings=safety_settings
)
05
Vertex AI Integration
Enterprise Deployment
GCP دا كارخانا production ئىشلىتىش
Vertex AI بولسا Google Cloud نىڭ ML سۇپىسى. كارخانا سەۋىيىسىدىكى security، compliance ۋە scalability تەمىنلەيدۇ. Gemini نى production دا ئىشلەتمەكچى بولسىڭىز Vertex AI تەۋسىيە.
PYTHONvertex_example.py
import vertexai
from vertexai.generative_models import GenerativeModel, Part

# پروژىنى باشلاش
vertexai.init(project="your-project-id", location="us-central1")

# مودېلنى قۇرۇش
model = GenerativeModel("gemini-2.0-pro")

# تېكىست ھاسىل قىلىش
response = model.generate_content(
    "Cloud architecture ھەققىدە تۈشەندۈر"
)

# رەسىم بىلەن
image = Part.from_uri(
    "gs://bucket/image.jpg",
    mime_type="image/jpeg"
)
response = model.generate_content(["بۇ رەسىمنى تەھلىل قىل", image])
Feature
Grounding
Grounding
Google Search ياكى ئۆز سانلىق مەلۇماتىڭىز بىلەن grounding. Hallucination نى ئازايتىدۇ.
Feature
Function Calling
Function Calling
سىرتقى API ۋە قوراللارنى چاقىرىش. Agent قۇرۇشقا ئاساس.
06
ئەمەلىي قوللىنىشلار
Practical Use Cases
Gemini بىلەن نېمە قىلغىلى بولىدۇ
Use Case
Document Analysis
ھۆججەت تەھلىلى
PDF، رەسىم، جەدۋەلدىن مەلۇمات ئېلىش. 1M token context بىلەن چوڭ ھۆججەتلەرنى پۈتۈنلەي بىر تەرەپ قىلىش.
Use Case
Code Assistant
كود ياردەمچىسى
كود يېزىش، چۈشەندۈرۈش، debugging. رەسىمدىكى UI دىن كود ھاسىل قىلىش.
Use Case
Video Summary
ۋىدىيو خۇلاسىسى
ۋىدىيونى كۆرۈپ، مەزمۇنىنى خۇلاسىلەش، مۇھىم نۇقتىلارنى چىقىرىش، سوئاللارغا جاۋاب بېرىش.
Use Case
Research Assistant
تەتقىقات ياردەمچىسى
ئىلمىي ماقالە، تەتقىقات نەتىجىسىنى ئوقۇش، خۇلاسىلەش ۋە سوئال-جاۋاب.

Long Context ئىشلىتىش

PYTHONlong_context.py
# چوڭ ھۆججەتنى ئوقۇش
with open("large_document.txt", "r") as f:
    document = f.read()

# Gemini 1M+ token نى بىر تەرەپ قىلالايدۇ
response = model.generate_content([
    f"""بۇ ھۆججەتنى ئوقۇپ، تۆۋەندىكى سوئاللارغا جاۋاب بەر:
1. ئاساسىي تېما نېمە؟
2. قانداق خۇلاسە چىقارغىلى بولىدۇ؟
3. مۇھىم سانلىق مەلۇماتلار قايسىلار؟

ھۆججەت:
{document}"""
])
07
باشقا مودېللار بىلەن مۇقايىسە
Comparison with Other Models
GPT-4، Claude ۋە Gemini
ئۆلچەمGemini 2.0GPT-4oClaude 3.5
Context Window2M tokens128K tokens200K tokens
MultimodalNativeNativeVision only
VideoNativeچەكلىكيوق
On-deviceNanoيوقيوق
GroundingGoogle Searchچەكلىكيوق
قاچان Gemini تاللاش: ئۇزۇن ھۆججەت، ۋىدىيو تەھلىلى، Google ecosystem بىلەن integration، ياكى تۆۋەن باھا كۆپ چىقىم لازىم بولغاندا Gemini ياخشى تاللاش. Reasoning ۋە coding دا ھەر ئۈچ مودېل ئوخشاش كۈچلۈك.
08
Google AI Studio
Quick Prototyping
كود يازماي Gemini نى سىناش
Feature
Chat Interface
سۆھبەت كۆرۈنمىسى
توركۆرگۈدە بىۋاسىتە Gemini بىلەن سۆھبەتلىشىش. رەسىم، ھۆججەت يۈكلەش.
Feature
Prompt Tuning
Prompt تەڭشەش
ھەر خىل prompt نى سىناش، temperature تەڭشەش، نەتىجىنى كۆرۈش.
Feature
Code Export
كود ئېكسپورت
تەييارلىغان prompt ۋە تەڭشەكنى Python، JavaScript ياكى cURL كودىغا ئايلاندۇرۇش.
Feature
Free Tier
ھەقسىز قەۋەت
ئۆگىنىش ۋە prototype ئۈچۈن ھەقسىز API چاقىرىش چەكلىمىسى بار.
aistudio.google.com — بۇ يەردە API key ئېلىش، مودېللارنى سىناش ۋە كود ئېكسپورت قىلىش. باشلاش ئۈچۈن ئەڭ تېز يول.