Bulut Tabanlı Bilgisayarlı Görü Kullanılarak Sesli Betimleme Sistem Tasarımı

KARAGÖZ, Emre; KORUYAN, Kutan

AçıkErişim Ana Sayfası
→
Akademik Dergiler
→
Mehmet Akif Ersoy Üniversitesi Uygulamalı Bilimler Dergisi
→
Öğe Göster

Bulut Tabanlı Bilgisayarlı Görü Kullanılarak Sesli Betimleme Sistem Tasarımı

Başlık: Bulut Tabanlı Bilgisayarlı Görü Kullanılarak Sesli Betimleme Sistem Tasarımı;
Design of Audio Description System Using Cloud Based Computer Vision

KARAGÖZ, Emre; KORUYAN, Kutan

Bağlantı: https://hdl.handle.net/11672/2997

Açıklama:

Multimedyaaraçlarındaki gelişim ve değişimler hayatın birçok alanında aktif şekildekullanılmakta ve büyük oranda artı değer kazandırmaktadır. Yapay zekâkavramının son derece gelişmiş olduğu günümüzde, özellikle engelli bireylerinyaşam standartlarını destekleyecek yüzlerce uygulama ve metot bulunmaktadır. Buçalışmada geliştirilen sistem özellikle görme engelli bireylerin izlediklerifilm, belgesel gibi video formatındaki medya çıktı sahnelerinin görüntüimgeleme tekniği sayesinde otomatik olarak betimlenmesini ve sonuçlarınkullanıcılara sesli olarak aktarılmasını sağlamaktadır. Sistemingörselleştirilmesinde HTML5 ve CSS, programlanmasında PHP ve JAVASCRIPT dillerikullanılmıştır. Sistemin veritabanı olarak MySQL tercih edilmiştir. Yapay zekâve bilişim teknolojilerinden olan bilgisayarlı görü, metinden konuşmaya çevirmeve bir dilden başka bir dile çeviri, bu çalışmada kullanılan temelenstrümanlardır. Görüntü imgeleme işlemleri için bulut tabanlı Microsoft AZUREComputer Vision API, metinden sese çevirme için Javascript Responce.jskütüphanesi, bir dilden başka bir dile çeviri işlemlerinde ise Google CloudText-To-Speech ve Microsoft Azure Text to Speech API’leri kullanılmıştır.

Developmentsand changes in multimedia tools are actively used in many areas of life andbring a huge value to them. Nowadays, the concept of artificial intelligence ishighly developed and there are hundreds of practices and methods to support theliving standards especially for people with disabilities. The system developedin this study enables automatic visualization of the media output scenes suchas movies, documentaries, etc., which are visually impaired people by means ofcomputer vision technique, and the results are transferred to the users byvoice command. HTML5 and CSS are used for visualizing the system, PHP andJAVASCRIPT are used for programming. MySQL is preferred as the database of thesystem. Computer vision, translation from text to speech and translation fromone language to another are the main instruments used in this study.Cloud-based Microsoft AZURE Computer Vision API is used for computer vision,Javascript Responce.js library is used for text-to-speech translation, GoogleCloud Text-To-Speech and Microsoft Azure Text to Speech APIs are used fortranslation from one language to another one.

Tüm öğe kaydını göster

Bu öğenin dosyaları:

Dosyalar	Boyut	Biçim	Göster
Bu öğe ile ilişkili dosya yok.

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

Mehmet Akif Ersoy Üniversitesi Uygulamalı Bilimler Dergisi
Mehmet Akif Ersoy Üniversitesi Uygulamalı Bilimler Dergisi 2020 Eylül sayısı için makale kabulüne başlamıştır. Mehmet Akif Ersoy Üniversitesi Uygulamalı Bilimler Dergisi TÜBİTAK ULAKBİM TR Dizin tarafından izlenmektedir.

Bulut Tabanlı Bilgisayarlı Görü Kullanılarak Sesli Betimleme Sistem Tasarımı

Bulut Tabanlı Bilgisayarlı Görü Kullanılarak Sesli Betimleme Sistem Tasarımı

Açıklama:

Bu öğenin dosyaları:

Bu öğe aşağıdaki koleksiyon(lar)da görünmektedir.

AçıkErişim'de Ara

Göz at

Tüm AçıkErişim

Bu Koleksiyon

Hesabım