Google Vision APIని ఉపయోగించి మీరు ఇమేజ్ నుండి సంగ్రహించిన వచనాన్ని ఎలా యాక్సెస్ చేయవచ్చు?

by EITCA అకాడమీ / బుధవారం, 27 డిసెంబర్ 2023 / ప్రచురింపబడి కృత్రిమ మేధస్సు, EITC/AI/GVAPI గూగుల్ విజన్ API, దృశ్య డేటాలో వచనాన్ని అర్థం చేసుకోవడం, చేతివ్రాత నుండి వచనాన్ని గుర్తించడం మరియు సంగ్రహించడం, పరీక్ష సమీక్ష

Google Vision APIని ఉపయోగించి చిత్రం నుండి సంగ్రహించబడిన వచనాన్ని యాక్సెస్ చేయడానికి, మీరు API యొక్క ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్ (OCR) సామర్థ్యాలను ఉపయోగించుకునే దశల శ్రేణిని అనుసరించవచ్చు. Google Vision APIలోని OCR సాంకేతికత చేతివ్రాతతో సహా చిత్రాల నుండి వచనాన్ని గుర్తించడం మరియు సంగ్రహించడం ప్రారంభిస్తుంది. విజువల్ డేటాలో ఉన్న పాఠ్య సమాచారం యొక్క విశ్లేషణ మరియు అవగాహన అవసరమయ్యే అప్లికేషన్‌లలో ఈ కార్యాచరణ ప్రత్యేకంగా ఉపయోగపడుతుంది.

ముందుగా, మీరు Google Vision APIతో పని చేయడానికి అవసరమైన వాతావరణాన్ని సెటప్ చేయాలి. ఇది Google క్లౌడ్ కన్సోల్‌లో ప్రాజెక్ట్‌ను సృష్టించడం, విజన్ APIని ప్రారంభించడం మరియు API కీ లేదా సేవా ఖాతా కీ వంటి అవసరమైన ప్రమాణీకరణ ఆధారాలను పొందడం వంటివి కలిగి ఉంటుంది.

మీ పర్యావరణాన్ని సెటప్ చేసిన తర్వాత, మీరు ఇమేజ్ ఫైల్‌లో OCR నిర్వహించడానికి Vision API యొక్క `asyncBatchAnnotateFiles` పద్ధతిని ఉపయోగించవచ్చు. ఈ పద్ధతి ప్రాసెసింగ్ కోసం ఇమేజ్ ఫైల్‌ల జాబితాను పాస్ చేయడానికి మరియు ఫలితాలను అసమకాలికంగా స్వీకరించడానికి మిమ్మల్ని అనుమతిస్తుంది. ప్రత్యామ్నాయంగా, మీరు చిత్రాల జాబితాను నేరుగా ప్రాసెస్ చేయడానికి `asyncBatchAnnotateImages` పద్ధతిని ఉపయోగించవచ్చు.

చిత్రం నుండి వచనాన్ని సంగ్రహించడానికి, మీరు `AnnotateImageRequest` వస్తువు యొక్క ఉదాహరణను సృష్టించాలి మరియు కావలసిన లక్షణాలను పేర్కొనాలి. ఈ సందర్భంలో, మీరు చిత్రం నుండి వచనాన్ని సంగ్రహించాలనుకుంటున్నారని సూచించడానికి మీరు `TEXT_DETECTION` లక్షణాన్ని సెట్ చేస్తారు. OCR యొక్క ఖచ్చితత్వాన్ని మెరుగుపరచడానికి మీరు భాష సూచన వంటి అదనపు పారామితులను కూడా పేర్కొనవచ్చు.

తర్వాత, మీరు ఇమేజ్ ఫైల్‌ను బేస్64-ఎన్‌కోడ్ చేసిన స్ట్రింగ్‌లోకి ఎన్‌కోడ్ చేయాలి మరియు ఎన్‌కోడ్ చేసిన ఇమేజ్ డేటాను ఉపయోగించి `ఇమేజ్` ఆబ్జెక్ట్‌ను క్రియేట్ చేయాలి. ఈ `చిత్రం` ఆబ్జెక్ట్‌ను ముందుగా సృష్టించిన `AnnotateImageRequest` ఆబ్జెక్ట్‌కి జోడించాలి.

అభ్యర్థనను సెటప్ చేసిన తర్వాత, మీరు ఎంచుకున్న విధానాన్ని బట్టి `batchAnnotateImages` లేదా `batchAnnotateFiles` పద్ధతిని ఉపయోగించి మీరు దానిని Vision APIకి పంపవచ్చు. API చిత్రాన్ని ప్రాసెస్ చేస్తుంది మరియు సంగ్రహించిన వచనాన్ని కలిగి ఉన్న ప్రతిస్పందనను అందిస్తుంది.

ప్రతిస్పందన నుండి సంగ్రహించబడిన వచనాన్ని యాక్సెస్ చేయడానికి, మీరు `AnnotateImageResponse` ఆబ్జెక్ట్ యొక్క `టెక్స్ట్ ఉల్లేఖనాలు` ఫీల్డ్‌లో మళ్లీ మళ్లీ చెప్పవచ్చు. ఈ ఫీల్డ్ `EntityAnnotation` ఆబ్జెక్ట్‌ల జాబితాను కలిగి ఉంది, ప్రతి ఒక్కటి చిత్రంలో గుర్తించబడిన వచన మూలకాన్ని సూచిస్తాయి. ప్రతి `EntityAnnotation` ఆబ్జెక్ట్ యొక్క `వివరణ` ఫీల్డ్ సంగ్రహించిన వచనాన్ని కలిగి ఉంటుంది.

Google Vision APIని ఉపయోగించి చిత్రం నుండి సంగ్రహించబడిన వచనాన్ని ఎలా యాక్సెస్ చేయాలో వివరించే పైథాన్‌లోని ఉదాహరణ కోడ్ స్నిప్పెట్ ఇక్కడ ఉంది:

python
from google.cloud import vision

def extract_text_from_image(image_path):
    client = vision.ImageAnnotatorClient()

    with open(image_path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)

    request = vision.AnnotateImageRequest(
        image=image,
        features=[{'type': vision.Feature.Type.TEXT_DETECTION}]
    )

    response = client.batch_annotate_images(requests=[request])

    for annotation in response.responses[0].text_annotations:
        extracted_text = annotation.description
        print(extracted_text)

# Usage
extract_text_from_image('path_to_image.jpg')

ఈ ఉదాహరణలో, `extract_text_from_image` ఫంక్షన్ ఇన్‌పుట్‌గా ఇమేజ్ ఫైల్‌కి పాత్‌ను తీసుకుంటుంది మరియు Vision APIకి అభ్యర్థనను పంపడానికి Google Cloud Vision క్లయింట్ లైబ్రరీని ఉపయోగిస్తుంది. సంగ్రహించిన వచనం తర్వాత ముద్రించబడుతుంది.

Google Vision APIని ఉపయోగించి చిత్రం నుండి సంగ్రహించబడిన వచనాన్ని యాక్సెస్ చేయడానికి, మీరు పర్యావరణాన్ని సెటప్ చేయాలి, కావలసిన లక్షణాలతో `AnnotateImageRequest` ఆబ్జెక్ట్‌ని సృష్టించాలి, ఇమేజ్ ఫైల్‌ను ఎన్‌కోడ్ చేయాలి, అభ్యర్థనను APIకి పంపాలి మరియు సంగ్రహించిన వచనాన్ని తిరిగి పొందాలి ప్రతిస్పందన నుండి. విజన్ API యొక్క OCR సామర్థ్యాలు చేతివ్రాతతో సహా చిత్రాల నుండి వచనాన్ని గుర్తించడం మరియు సంగ్రహించడం ప్రారంభించాయి.

సంబంధించి ఇతర ఇటీవలి ప్రశ్నలు మరియు సమాధానాలు చేతివ్రాత నుండి వచనాన్ని గుర్తించడం మరియు సంగ్రహించడం:

మరిన్ని ప్రశ్నలు మరియు సమాధానాలు:

కింద ట్యాగ్ చేయబడింది: కృత్రిమ మేధస్సు, Google క్లౌడ్ విజన్ API, బొమ్మ లేదా చిత్రం సరి చేయడం, OCR, ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్, టెక్స్ట్ ఎక్స్‌ట్రాక్షన్

EITCA అకాడమీ

Google Vision APIని ఉపయోగించి మీరు ఇమేజ్ నుండి సంగ్రహించిన వచనాన్ని ఎలా యాక్సెస్ చేయవచ్చు?

సంబంధించి ఇతర ఇటీవలి ప్రశ్నలు మరియు సమాధానాలు చేతివ్రాత నుండి వచనాన్ని గుర్తించడం మరియు సంగ్రహించడం:

మరిన్ని ప్రశ్నలు మరియు సమాధానాలు:

EITCA అకాడమీ అనేది యూరోపియన్ IT సర్టిఫికేషన్ ఫ్రేమ్‌వర్క్‌లో ఒక భాగం

EITCA అకాడమీకి అర్హత 80% EITCI DSJC సబ్సిడీ మద్దతు

EITCA అకాడమీ

మీ యూజర్‌నేమ్ లేదా ఇమెయిల్ చిరునామా ద్వారా మీ ఖాతాకు లాగిన్ అవ్వండి

మీ వివరాలు మర్చిపోయారా?

ఒక ఎకౌంటు సృష్టించు

Google Vision APIని ఉపయోగించి మీరు ఇమేజ్ నుండి సంగ్రహించిన వచనాన్ని ఎలా యాక్సెస్ చేయవచ్చు?

సంబంధించి ఇతర ఇటీవలి ప్రశ్నలు మరియు సమాధానాలు చేతివ్రాత నుండి వచనాన్ని గుర్తించడం మరియు సంగ్రహించడం:

మరిన్ని ప్రశ్నలు మరియు సమాధానాలు:

EITCA అకాడమీకి అర్హత 80% EITCI DSJC సబ్సిడీ మద్దతు