1 ပတ် - ဘာသာပြန်ပါ။

Google Gemini မှာ အသစ်ထည့်သွင်းထားသော Image အသုံးပြုမှု အကြောင်း အသေးစိတ်။
Google Gemini (ယခင်အခေါ် Bard) ဟာ Multimodal AI model တစ်ခုဖြစ်ပြီး စာသား၊ အသံနဲ့ ပုံရိပ် (Image) စတဲ့ သတင်းအမျိုးမျိုးကို နားလည်၊ ကိုင်တွယ်၊ ထုတ်ပေးနိုင်စွမ်းရှိပါတယ်။ လတ်တလော အပ်ဒိတ်တွေမှာ ပုံရိပ်နဲ့ပတ်သက်တဲ့ စွမ်းရည်တွေ သိသိသာသာ မြှင့်တင်လာခဲ့ပါတယ်။
၁။ ပုံထဲမှာပါတဲ့ အကြောင်းအရာကို ရှင်းလင်းဖော်ပြခြင်း (Image Description)
သင့်မှာ မြင်တွေ့နေရတဲ့ ပုံတစ်ပုံအကြောင်း နားမလည်ဘူးဆိုရင် Gemini ကို ပုံထဲမှာ ဘာတွေရှိလဲမေးနိုင်ပါတယ်။
📍ဥပမာ: သမိုင်းဝင် နေရာတစ်ခုရဲ့ ဓာတ်ပုံတင်ပြီး "ဒီပုံကဘယ်နေရာလဲ? ဒီဗိသုကာလက်ရာအကြောင်း ရှင်းပြပေးပါ" လို့မေးမယ်ဆိုရင် Gemini က နေရာအမည်၊ တည်နေရာ၊ သမိုင်းကြောင်းနဲ့ ဗိသုကာလက်ရာအကြောင်း အသေးစိတ်ဖော်ပြပေးနိုင်ပါတယ်။
အသုံးဝင်ပုံ: မျက်မမြင်သူများ အတွက် ပုံကိုစာသားအဖြစ် ပြောင်းပေးခြင်း၊ သုတေသနလုပ်ငန်းတွေမှာ ပုံတွေကို အလွယ်တကူ ခွဲခြမ်းစိတ်ဖြာနိုင်ခြင်း။
၂။ ပုံထဲမှာပါတဲ့ စာသားများကို ဖတ်ပေးခြင်း (OCR - Optical Character Recognition)
Gemini ဟာ ပုံထဲမှာပါတဲ့ စာသားတွေကို အလိုအလျောက် ဖတ်နိုင်စွမ်းရှိပါတယ်။
ဥပမာ: သင်ခန်းစာ ဆရာတစ်ယောက်အနေနဲ့ ကျောင်းသားတွေရဲ့ လက်ရေးစာရွက်ပုံတွေကို တင်ပြီး အမှတ်ပေးဖို့ Gemini ကို အကူအညီတောင်းနိုင်ပါတယ်။
မှတ်စုတို၊ လက်ချာပုံ၊ ဆိုင်းဘုတ် (သို့) စာအုပ်ဖုံးပုံတစ်ပုံကို တင်ပြီး "ဒီပုံထဲမှာရေးထားတဲ့စာသားတွေကို ကူးယူပေးပါ" လို့မေးမယ်ဆိုရင် Gemini က စာသားအဖြစ် ပြန်လည်ထုတ်ပေးပါလိမ့်မယ်။
အသုံးဝင်ပုံ: လက်ရေးမှတ်စုတွေကို ဒီဂျစ်တယ်စာသားအဖြစ် ပြောင်းလဲခြင်း၊ ဆိုင်းဘုတ်တွေကနေ အချက်အလက်ယူခြင်း၊ ပုံထဲကစာသားကို ဘာသာပြန်ဆိုခြင်း။
၃။ ပုံများကို အခြေခံ၍ သုတေသနလုပ်ခြင်းနှင့် သင်ယူခြင်း။
ပုံတစ်ပုံကနေ တစ်ဆင့် ဗဟုသုတအသစ်တွေ ရှာဖွေနိုင်ပါတယ်။
ဥပမာ: ခရီးသွားတစ်ယောက်အနေနဲ့ မသိသေးတဲ့ အပင်တစ်မျိုးရဲ့ပုံကို တင်ပြီး "ဒီအပင်က ဘာနာမည်လဲ? ဒီအပင် အကြောင်း ရှင်းပြပေးပါ" လို့မေးမယ်ဆိုရင် Gemini က အပင်အမျိုးအစား၊ စိုက်ပျိုးနည်း၊ ဂုဏ်သတ္တိများကို ရှင်းပြပေးနိုင်ပါတယ်။
ရှုပ်ထွေးတဲ့ ဂရပ်ပုံ (Graph) တစ်ခုကို တင်ပြီး "ဒီဂရပ်ပုံကနေ ဘာအချက်အလက်တွေကောက်ချက်ချ်လို့ရလဲ?"လို့မေးနိုင်ပါတယ်။
အသုံးဝင်ပုံ: ပညာရေးဆိုင်ရာ သုတေသန၊ နေ့စဉ်ဘဝမှာ ကြုံတွေ့ရတဲ့ အရာဝတ္ထုတွေအကြောင်း လေ့လာခြင်း။
၄။ ပုံများကို အခြေခံ၍ ဖန်တီးမှုများ ပြုလုပ်ခြင်း (Creative Assistance)
Gemini ကို ပုံတစ်ပုံပေးပြီး ဖန်တီးမှုဆိုင်ရာ အကူအညီတောင်းနိုင်ပါတယ်။
ဥပမာ: ကိုယ်ရေးကိုယ်တာ ဓာတ်ပုံတစ်ပုံ (သို့) အိမ်အပြင်အဆင်ပုံတစ်ပုံတင်ပြီး "ဒီပုံအတွက် Instagram မှာ တင်လို့ကောင်းမယ့် Caption (သို့) Hashtag တွေ အကြံပေးပါ"* လို့မေးနိုင်ပါတယ်။
ပန်းချီကားတစ်ချပ်ရဲ့ပုံတင်ပြီး "ဒီပန်းချီကားကို အတုခိုးထားတဲ့ ကဗျာ (သို့) ဝတ္ထုတိုတစ်ပုဒ် ရေးပေးပါ" လို့ ဖန်တီးခိုင်းနိုင်ပါတယ်။
အသုံးဝင်ပုံ: Social Media Content Creation, အနုပညာဖန်တီးမှုအတွက် စိတ်ကူးစရာ ရှာဖွေခြင်း။
၅။ ကုဒ်ဖတ်ခြင်းနှင့် ပြဿနာဖြေရှင်းခြင်း (Code & Problem Solving)
ပုံထဲမှာပါတဲ့ ကုဒ် (Code Snippet) ဒါမှမဟုတ် သင်္ချာပုစ္ဆာတွေကို Gemini က ဖတ်ပြီး ရှင်းလင်းပေးနိုင်ပါတယ်။
ဥပမာ: Programming လုပ်နေသူတစ်ယောက်အနေနဲ့ error message ပါတဲ့ စခရင်ရှော့ (screenshot) တင်ပြီး "ဒီ error က ဘာကိုဆိုလိုတာလဲ? ဘယ်လိုရှင်းမလဲ?" လို့မေးနိုင်ပါတယ်။
သင်္ချာစာရွက်ပေါ်က ညီမျှခြင်းတစ်ခုရဲ့ပုံကို တင်ပြီး "ဒီညီမျှခြင်းကို ရှင်းပြပေးပါ" လို့မေးမယ်ဆိုရင် Gemini က အဆင့်ဆင့်ရှင်းပြပေးပါလိမ့်မယ်။
အသုံးဝင်ပုံ: Developer များနဲ့ ကျောင်းသားများ အတွက် ပြဿနာဖြေရှင်းရာမှာ အကူအညီရရှိခြင်း။
၆။ မတူညီသော ဘာသာစကားများသို့ ဘာသာပြန်ဆိုခြင်း။
ပုံထဲကစာသားကို ဖတ်ပြီး ဘာသာပြန်ပေးနိုင်တဲ့အပြင် ပုံတစ်ပုံလုံးရဲ့ အကြောင်းအရာကိုလည်း အခြားဘာသာစကားနဲ့ ရှင်းပြနိုင်ပါတယ်။
ဥပမာ:ဂျပန်ဘာသာနဲ့ ရေးထားတဲ့ မီနူးစာရွက်ပုံတစ်ပုံကို တင်ပြီး "ဒီမီနူးမှာပါတဲ့ အစားအစာတွေကို အင်္ဂလိပ်လိုဘာသာပြန်ပေးပါ" လို့မေးနိုင်ပါတယ်။
အသုံးဝင်ပုံ: ခရီးသွားချိန် ဘာသာစကား အခက်အခဲကို ဖြေရှင်းခြင်း၊ နိုင်ငံတကာမှ စာရွက်စာတမ်းများကို နားလည်ခြင်း။
#အကျဉ်းချုပ်အားဖြင့်
Google Gemini ရဲ့ Image Understanding စွမ်းရည်ဟာ AI နဲ့ လူသားတွေရဲ့ အပြန်အလှန်ဆက်သွယ်မှုကို အသစ်တစ်မျိုး ပြောင်းလဲလိုက်ပါတယ်။ စာသားတင်မကဘဲ ကမ္ဘာကြီးကို မျက်စိနဲ့မြင်တဲ့အတိုင်း မေးမြန်းဆက်သွယ်လာနိုင်တာ ဟာ အဓိက အားသာချက်ဖြစ်ပါတယ်။ ဒီ feature က သုတေသန၊ ပညာရေး၊ နေ့စဉ်ဘဝ၊ ဖန်တီးမှုလုပ်ငန်းစဉ်တွေမှာ အရမ်းကို အသုံးဝင်ပြီး လုပ်ငန်းတွေကို ပိုမိုမြန်ဆန်၊ ထိရောက်၊ ပျော်ရွှင်စေမယ့် tool တစ်ခုဖြစ်လာပါတယ်။
𝑪𝒐𝒎𝒑𝒖𝒕𝒆𝒓 𝑶𝒏𝒍𝒊𝒏𝒆 𝑻𝒓𝒂𝒊𝒏𝒊𝒏𝒈

image