Google Vision APIని ఉపయోగించి చిత్రం నుండి సంగ్రహించబడిన వచనాన్ని యాక్సెస్ చేయడానికి, మీరు API యొక్క ఆప్టికల్ క్యారెక్టర్ రికగ్నిషన్ (OCR) సామర్థ్యాలను ఉపయోగించుకునే దశల శ్రేణిని అనుసరించవచ్చు. Google Vision APIలోని OCR సాంకేతికత చేతివ్రాతతో సహా చిత్రాల నుండి వచనాన్ని గుర్తించడం మరియు సంగ్రహించడం ప్రారంభిస్తుంది. విజువల్ డేటాలో ఉన్న పాఠ్య సమాచారం యొక్క విశ్లేషణ మరియు అవగాహన అవసరమయ్యే అప్లికేషన్లలో ఈ కార్యాచరణ ప్రత్యేకంగా ఉపయోగపడుతుంది.
ముందుగా, మీరు Google Vision APIతో పని చేయడానికి అవసరమైన వాతావరణాన్ని సెటప్ చేయాలి. ఇది Google క్లౌడ్ కన్సోల్లో ప్రాజెక్ట్ను సృష్టించడం, విజన్ APIని ప్రారంభించడం మరియు API కీ లేదా సేవా ఖాతా కీ వంటి అవసరమైన ప్రమాణీకరణ ఆధారాలను పొందడం వంటివి కలిగి ఉంటుంది.
మీ పర్యావరణాన్ని సెటప్ చేసిన తర్వాత, మీరు ఇమేజ్ ఫైల్లో OCR నిర్వహించడానికి Vision API యొక్క `asyncBatchAnnotateFiles` పద్ధతిని ఉపయోగించవచ్చు. ఈ పద్ధతి ప్రాసెసింగ్ కోసం ఇమేజ్ ఫైల్ల జాబితాను పాస్ చేయడానికి మరియు ఫలితాలను అసమకాలికంగా స్వీకరించడానికి మిమ్మల్ని అనుమతిస్తుంది. ప్రత్యామ్నాయంగా, మీరు చిత్రాల జాబితాను నేరుగా ప్రాసెస్ చేయడానికి `asyncBatchAnnotateImages` పద్ధతిని ఉపయోగించవచ్చు.
చిత్రం నుండి వచనాన్ని సంగ్రహించడానికి, మీరు `AnnotateImageRequest` వస్తువు యొక్క ఉదాహరణను సృష్టించాలి మరియు కావలసిన లక్షణాలను పేర్కొనాలి. ఈ సందర్భంలో, మీరు చిత్రం నుండి వచనాన్ని సంగ్రహించాలనుకుంటున్నారని సూచించడానికి మీరు `TEXT_DETECTION` లక్షణాన్ని సెట్ చేస్తారు. OCR యొక్క ఖచ్చితత్వాన్ని మెరుగుపరచడానికి మీరు భాష సూచన వంటి అదనపు పారామితులను కూడా పేర్కొనవచ్చు.
తర్వాత, మీరు ఇమేజ్ ఫైల్ను బేస్64-ఎన్కోడ్ చేసిన స్ట్రింగ్లోకి ఎన్కోడ్ చేయాలి మరియు ఎన్కోడ్ చేసిన ఇమేజ్ డేటాను ఉపయోగించి `ఇమేజ్` ఆబ్జెక్ట్ను క్రియేట్ చేయాలి. ఈ `చిత్రం` ఆబ్జెక్ట్ను ముందుగా సృష్టించిన `AnnotateImageRequest` ఆబ్జెక్ట్కి జోడించాలి.
అభ్యర్థనను సెటప్ చేసిన తర్వాత, మీరు ఎంచుకున్న విధానాన్ని బట్టి `batchAnnotateImages` లేదా `batchAnnotateFiles` పద్ధతిని ఉపయోగించి మీరు దానిని Vision APIకి పంపవచ్చు. API చిత్రాన్ని ప్రాసెస్ చేస్తుంది మరియు సంగ్రహించిన వచనాన్ని కలిగి ఉన్న ప్రతిస్పందనను అందిస్తుంది.
ప్రతిస్పందన నుండి సంగ్రహించబడిన వచనాన్ని యాక్సెస్ చేయడానికి, మీరు `AnnotateImageResponse` ఆబ్జెక్ట్ యొక్క `టెక్స్ట్ ఉల్లేఖనాలు` ఫీల్డ్లో మళ్లీ మళ్లీ చెప్పవచ్చు. ఈ ఫీల్డ్ `EntityAnnotation` ఆబ్జెక్ట్ల జాబితాను కలిగి ఉంది, ప్రతి ఒక్కటి చిత్రంలో గుర్తించబడిన వచన మూలకాన్ని సూచిస్తాయి. ప్రతి `EntityAnnotation` ఆబ్జెక్ట్ యొక్క `వివరణ` ఫీల్డ్ సంగ్రహించిన వచనాన్ని కలిగి ఉంటుంది.
Google Vision APIని ఉపయోగించి చిత్రం నుండి సంగ్రహించబడిన వచనాన్ని ఎలా యాక్సెస్ చేయాలో వివరించే పైథాన్లోని ఉదాహరణ కోడ్ స్నిప్పెట్ ఇక్కడ ఉంది:
python from google.cloud import vision def extract_text_from_image(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) request = vision.AnnotateImageRequest( image=image, features=[{'type': vision.Feature.Type.TEXT_DETECTION}] ) response = client.batch_annotate_images(requests=[request]) for annotation in response.responses[0].text_annotations: extracted_text = annotation.description print(extracted_text) # Usage extract_text_from_image('path_to_image.jpg')
ఈ ఉదాహరణలో, `extract_text_from_image` ఫంక్షన్ ఇన్పుట్గా ఇమేజ్ ఫైల్కి పాత్ను తీసుకుంటుంది మరియు Vision APIకి అభ్యర్థనను పంపడానికి Google Cloud Vision క్లయింట్ లైబ్రరీని ఉపయోగిస్తుంది. సంగ్రహించిన వచనం తర్వాత ముద్రించబడుతుంది.
Google Vision APIని ఉపయోగించి చిత్రం నుండి సంగ్రహించబడిన వచనాన్ని యాక్సెస్ చేయడానికి, మీరు పర్యావరణాన్ని సెటప్ చేయాలి, కావలసిన లక్షణాలతో `AnnotateImageRequest` ఆబ్జెక్ట్ని సృష్టించాలి, ఇమేజ్ ఫైల్ను ఎన్కోడ్ చేయాలి, అభ్యర్థనను APIకి పంపాలి మరియు సంగ్రహించిన వచనాన్ని తిరిగి పొందాలి ప్రతిస్పందన నుండి. విజన్ API యొక్క OCR సామర్థ్యాలు చేతివ్రాతతో సహా చిత్రాల నుండి వచనాన్ని గుర్తించడం మరియు సంగ్రహించడం ప్రారంభించాయి.
సంబంధించి ఇతర ఇటీవలి ప్రశ్నలు మరియు సమాధానాలు చేతివ్రాత నుండి వచనాన్ని గుర్తించడం మరియు సంగ్రహించడం:
- Google Vision APIని ఉపయోగించి సంక్లిష్ట పత్రాల నుండి టెక్స్ట్ని సంగ్రహించేటప్పుడు ఏ పరిమితులు తలెత్తవచ్చు?
- Google Vision API యొక్క టెక్స్ట్ యొక్క వివరణలో విశ్వాస స్థాయిల యొక్క ప్రాముఖ్యత ఏమిటి?
- Google Vision API చేతితో వ్రాసిన గమనికల నుండి వచనాన్ని ఎలా ఖచ్చితంగా గుర్తించగలదు మరియు సంగ్రహిస్తుంది?
- చేతితో వ్రాసిన చిత్రాల నుండి వచనాన్ని గుర్తించడం మరియు సంగ్రహించడంలో సవాళ్లు ఏమిటి?
- Google Vision చేతివ్రాతను గుర్తించగలదా?