

AI స్టార్టప్ DeepSeek, తన కొత్త DeepSeek-OCR అనే ఓపెన్ సోర్స్ మోడల్ను విడుదల చేసింది. ఈ మోడల్ ద్వారా ఆర్టిఫిషియల్ ఇంటెలిజెన్స్ టెక్స్ట్ను చదివే విధానంలో కొత్త మార్పు తీసుకువచ్చింది.ఈ టెక్నాలజీ సాధారణ టెక్స్ట్ను విశ్లేషించదు; దానిని 2D మ్యాప్గా మార్చి పిక్సెల్ల రూపంలో చదువుతుంది. దీన్ని కంపెనీ “Context Optical Compression” అని పిలుస్తోంది. దీని ద్వారా పెద్ద డాక్యుమెంట్లను చిన్న “విజన్ టోకెన్స్” రూపంలో కుదించవచ్చు, తద్వారా AI మోడల్ వేగంగా మరియు సమర్థవంతంగా ప్రాసెస్ చేయగలదు.ఉదాహరణకు, 1,000 పదాల ఆర్టికల్ను కేవలం 100 విజన్ టోకెన్స్ ద్వారా ప్రాసెస్ చేయవచ్చు. ఇది మెమరీ వాడకాన్ని తగ్గిస్తుంది మరియు పెద్ద కంటెంట్ను సులభంగా హ్యాండిల్ చేయగలదు.
మోడల్ పనిచేసే విధానం కూడా ఆసక్తికరంగా ఉంది — మొదట డాక్యుమెంట్ ఇమేజ్ను తీసి, ఒక కస్టమ్ విజన్ ఎన్కోడర్ ద్వారా చిన్న భాగాలుగా విభజిస్తుంది. ఆపై, డీకోడర్ వాటిని అర్థం చేసుకుని టెక్స్ట్ అర్థాన్ని తిరిగి పొందుతుంది.OpenAI సహ వ్యవస్థాపకుడు ఆండ్రేజ్ కార్పతి, ఈ సాంకేతికతను ప్రశంసిస్తూ, ఇది AI పనితీరును మరింత మెరుగుపరుస్తుందని మరియు భవిష్యత్తులో టోకెనైజర్ అవసరాన్ని పూర్తిగా తొలగించవచ్చని అన్నారు.ప్రస్తుతం DeepSeek-OCR మోడల్ GitHubలో అందుబాటులో ఉంది, విడుదలైన 24 గంటల్లోనే 6,700కు పైగా లైక్స్ సంపాదించింది. ఇది MIT లైసెన్స్ కింద అందుబాటులో ఉండడంతో, విద్యా మరియు వాణిజ్య అవసరాలకు ఉచితంగా వాడుకోవచ్చు.









.avif&w=3840&q=75)

కామెంట్స్ (0)
ఇప్పటికి కామెంట్స్ లేవు
మొదటిగా కామెంట్ చేయండి!