Multimedyaaraçlarındaki gelişim ve değişimler hayatın birçok alanında aktif şekildekullanılmakta ve büyük oranda artı değer kazandırmaktadır. Yapay zekâkavramının son derece gelişmiş olduğu günümüzde, özellikle engelli bireylerinyaşam standartlarını destekleyecek yüzlerce uygulama ve metot bulunmaktadır. Buçalışmada geliştirilen sistem özellikle görme engelli bireylerin izlediklerifilm, belgesel gibi video formatındaki medya çıktı sahnelerinin görüntüimgeleme tekniği sayesinde otomatik olarak betimlenmesini ve sonuçlarınkullanıcılara sesli olarak aktarılmasını sağlamaktadır. Sistemingörselleştirilmesinde HTML5 ve CSS, programlanmasında PHP ve JAVASCRIPT dillerikullanılmıştır. Sistemin veritabanı olarak MySQL tercih edilmiştir. Yapay zekâve bilişim teknolojilerinden olan bilgisayarlı görü, metinden konuşmaya çevirmeve bir dilden başka bir dile çeviri, bu çalışmada kullanılan temelenstrümanlardır. Görüntü imgeleme işlemleri için bulut tabanlı Microsoft AZUREComputer Vision API, metinden sese çevirme için Javascript Responce.jskütüphanesi, bir dilden başka bir dile çeviri işlemlerinde ise Google CloudText-To-Speech ve Microsoft Azure Text to Speech API’leri kullanılmıştır.
Developmentsand changes in multimedia tools are actively used in many areas of life andbring a huge value to them. Nowadays, the concept of artificial intelligence ishighly developed and there are hundreds of practices and methods to support theliving standards especially for people with disabilities. The system developedin this study enables automatic visualization of the media output scenes suchas movies, documentaries, etc., which are visually impaired people by means ofcomputer vision technique, and the results are transferred to the users byvoice command. HTML5 and CSS are used for visualizing the system, PHP andJAVASCRIPT are used for programming. MySQL is preferred as the database of thesystem. Computer vision, translation from text to speech and translation fromone language to another are the main instruments used in this study.Cloud-based Microsoft AZURE Computer Vision API is used for computer vision,Javascript Responce.js library is used for text-to-speech translation, GoogleCloud Text-To-Speech and Microsoft Azure Text to Speech APIs are used fortranslation from one language to another one.