టెక్స్ట్‌ను ఇమేజ్‌లా చదివే కొత్త AI మోడల్ – DeepSeek-OCRను విడుదల చేసిన DeepSeek

Writer: Venkatesh 09:33 AM, 22 అక్టోబర్, 2025

AI స్టార్టప్ DeepSeek, తన కొత్త DeepSeek-OCR అనే ఓపెన్ సోర్స్ మోడల్‌ను విడుదల చేసింది. ఈ మోడల్ ద్వారా ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ టెక్స్ట్‌ను చదివే విధానంలో కొత్త మార్పు తీసుకువచ్చింది.ఈ టెక్నాలజీ సాధారణ టెక్స్ట్‌ను విశ్లేషించదు; దానిని 2D మ్యాప్‌గా మార్చి పిక్సెల్‌ల రూపంలో చదువుతుంది. దీన్ని కంపెనీ “Context Optical Compression” అని పిలుస్తోంది. దీని ద్వారా పెద్ద డాక్యుమెంట్లను చిన్న “విజన్ టోకెన్స్” రూపంలో కుదించవచ్చు, తద్వారా AI మోడల్ వేగంగా మరియు సమర్థవంతంగా ప్రాసెస్ చేయగలదు.ఉదాహరణకు, 1,000 పదాల ఆర్టికల్‌ను కేవలం 100 విజన్ టోకెన్స్ ద్వారా ప్రాసెస్ చేయవచ్చు. ఇది మెమరీ వాడకాన్ని తగ్గిస్తుంది మరియు పెద్ద కంటెంట్‌ను సులభంగా హ్యాండిల్ చేయగలదు.

మోడల్ పనిచేసే విధానం కూడా ఆసక్తికరంగా ఉంది — మొదట డాక్యుమెంట్ ఇమేజ్‌ను తీసి, ఒక కస్టమ్ విజన్ ఎన్‌కోడర్ ద్వారా చిన్న భాగాలుగా విభజిస్తుంది. ఆపై, డీకోడర్ వాటిని అర్థం చేసుకుని టెక్స్ట్ అర్థాన్ని తిరిగి పొందుతుంది.OpenAI సహ వ్యవస్థాపకుడు ఆండ్రేజ్ కార్పతి, ఈ సాంకేతికతను ప్రశంసిస్తూ, ఇది AI పనితీరును మరింత మెరుగుపరుస్తుందని మరియు భవిష్యత్తులో టోకెనైజర్ అవసరాన్ని పూర్తిగా తొలగించవచ్చని అన్నారు.ప్రస్తుతం DeepSeek-OCR మోడల్ GitHubలో అందుబాటులో ఉంది, విడుదలైన 24 గంటల్లోనే 6,700కు పైగా లైక్స్ సంపాదించింది. ఇది MIT లైసెన్స్ కింద అందుబాటులో ఉండడంతో, విద్యా మరియు వాణిజ్య అవసరాలకు ఉచితంగా వాడుకోవచ్చు.