spuuntries/urna-kp3l 🖼️🔢📝✓ → 📝

▶️ 108 runs 📅 Jun 2025 ⚙️ Cog 0.9.6 🔗 GitHub
image-captioning image-to-text visual-question-answering

About

A project that I recycled for many of my classes as their Final Project assignments.

Example Output

Prompt:

"Apakah orang ini tersenyum?"

Output

Di tengah gambar, seorang pemuda berdiri dengan senyum cerah di wajahnya. Wajahnya dihiasi dengan kumis yang khas, menambahkan sentuhan pesona pada penampilannya. Dia mengenakan kemeja abu-abu, yang kontras dengan keseluruhan skema warna yang redup di ruangan. Sebuah syal hitam terikat di lehernya, memberikan sentuhan elegan dan menambahkan elemen intrik pada gambar. Tangan kanannya memegang telepon ke telinga kirinya, menunjukkan bahwa dia mungkin sedang dalam percakapan atau mungkin tenggelam dalam pikiran. Latar belakangnya kabur, menarik fokus pada wajah dan ekspresi berlumuran senyum pemuda itu.

Performance Metrics

2.48s Prediction Time
2.49s Total Time
All Input Parameters
{
  "image": "https://replicate.delivery/pbxt/NE1oV1iWQ1kjQn8z7XaeVb4v2CnY3w3Oh2Orkh686VSTzYgV/sayang3.jpg",
  "top_k": 0,
  "top_p": 0,
  "prompt": "Apakah orang ini tersenyum?",
  "do_sample": true,
  "temperature": 0,
  "max_new_tokens": 256,
  "repetition_penalty": 0
}
Input Parameters
image (required) Type: string
Input image
top_k Type: integerDefault: 0Range: 0 - 100
Top-k sampling parameter (0 to disable/use transformer defaults)
top_p Type: numberDefault: 0Range: 0 - 1
Top-p (nucleus) sampling parameter (0 to use transformer defaults)
prompt Type: stringDefault: Describe this image
Input prompt
do_sample Type: booleanDefault: true
Whether to use sampling
temperature Type: numberDefault: 0Range: 0 - 2
Temperature for sampling (0 to use transformer defaults)
max_new_tokens Type: integerDefault: 512Range: 1 - 2048
Maximum number of tokens to generate
repetition_penalty Type: numberDefault: 0Range: 0 - 2
Repetition penalty (0 to use transformer defaults)
Output Schema

Output

Type: string

Version Details
Version ID
9338a4573a17178b70515c0ef2e613d3b4213e2dc860ef23b3ad6149dacadc1e
Version Created
June 21, 2025
Run on Replicate →