gemini api로 이미지 인식
2024-07-08 19:40:51
gemini api는 기능이 훌륭한데 많이 사용하지 않고 있습니다. 후발 주자라서 일까요? 덕분에 혼자 사용하기에 성능도 괜찮고 무료라서 부담도 없군요. API-KEY만 노출되지 않으면 혼자 사용은 거의 무료입니다.
gemini api로 이미지 인식 실습
위 그림이 어떤 그림인 지 아실시요?
위 그림은 피카소의 그림입니다.
gemini api에게 피카소 그림인 것을 알려주지 않고 평가해 달라고 요청해보겠습니다. 어떻게 답할 지 궁금하군요.
API-KEY는 아래 페이지에서 얻으시면 됩니다.
Gemini API-KEY
import pathlib
import google.generativeai as genai
# API 키 설정
genai.configure(api_key='YOUR-API-KEY')
# Gemini Pro Vision 모델 생성
model = genai.GenerativeModel('gemini-1.5-flash')
# 이미지 파일 로드
image_path = r'c:\img\img01.png'
image = {
'mime_type': 'image/png',
'data': pathlib.Path(image_path).read_bytes()
}
# 프롬프트 설정
prompt = "이 그림이 잘 그린 그림인 지 평가해 줘."
# 컨텐츠 생성 요청
response = model.generate_content([prompt, image])
# 결과 출력
print(response.text)
이 그림은 파블로 피카소의 작품으로, 미술사적 가치가 높은 작품입니다. 피카소의 독특한 스타일과 선의 아름다움이 돋보이며, 단순한 선으로 표현된 인물의 모습은 강렬한 인상을 남깁니다.
이 그림은 개인의 미적 취향에 따라 다르게 평가될 수 있지만, 피카소의 예술적 천재성이 엿보이는 걸작으로 인정받고 있습니다.
피카소 작품인 것을 잘 인식하는 군요.
코랩에서 실행하려면 아래 코드를 이용하시면 됩니다.
파이썬 개발 환경이 설치되어 있지 않으시다면 코랩에서 실행해보실 수 있습니다.
# google-generativeai 패키지 설치
!pip install google-generativeai
import pathlib
import google.generativeai as genai
from google.colab import files
# API 키 설정
genai.configure(api_key='YOUR-API-KEY')
# Gemini Pro Vision 모델 생성
model = genai.GenerativeModel('gemini-1.5-flash')
# 사용자로부터 이미지 파일 업로드 받기
uploaded = files.upload()
# 업로드한 파일의 경로 설정
image_path = next(iter(uploaded))
# 이미지 파일 로드
image = {
'mime_type': 'image/png',
'data': pathlib.Path(image_path).read_bytes()
}
# 프롬프트 설정
prompt = "이 그림이 잘 그린 그림인 지 평가해 줘."
# 컨텐츠 생성 요청
response = model.generate_content([prompt, image])
# 결과 출력
print(response.text)