Grounded report generation for enhancing ophthalmic ultrasound interpretation using Vision-Language Segmentation models - Takeaways - MDSpire

Grounded report generation for enhancing ophthalmic ultrasound interpretation using Vision-Language Segmentation models

By
Kai Jin
Qixuan Sun
Daohuan Kang
Ziyao Luo
Tao Yu
Wenzheng Han
Yi Zhang
Meng Wang
Danli Shi
Andrzej Grzybowski
January 3, 2026
0 min

Npj Digital Medicine

Share

1

Ophthalmic ultrasound is essential for diagnosing eye conditions but requires significant expertise and time for accurate interpretation.
2

Traditional AI models in medical imaging lack integration with report generation, limiting their interpretability and practical utility.
3

Recent advancements in Vision-Language Models (VLM) and Segment Anything Model (SAM) enhance diagnostic accuracy and report generation.
4

The study introduces a novel AI model that combines VLM and SAM to generate comprehensive reports and annotate lesions in ophthalmic ultrasound.
5

AI-assisted ocular ultrasound reporting improves diagnostic accuracy and reduces reporting time, validating its potential as an auxiliary tool.

Original Source(s)

Npj Digital Medicine

Grounded report generation for enhancing ophthalmic ultrasound interpretation using Vision-Language Segmentation models

by Kai Jin, Qixuan Sun, Daohuan Kang, Ziyao Luo, Tao Yu, Wenzheng Han, Yi Zhang, Meng Wang, Danli Shi, Andrzej Grzybowski
January 3, 2026

Related Content

Npj Digital Medicine

Closed loop text guided framework for lung cancer lesion segmentation and quantification

European Radiology

Navigating the CT wave: multicentric chest imaging trends before, during, and after COVID-19 Pandemic

by Thiago Lima, Natalia Saltybaeva, Tobias Gassenmaier, Lukas Ebner, Justus E. Roos
October 8, 2025

European Radiology

Are we systematically overdosing women? Revisiting standardized contrast protocols for thoracoabdominal CT scans