• Türkçe
    • English
  • English 
    • Türkçe
    • English
  • Login
View Item 
  •   DSpace@MEF
  • Fakülteler
  • Mühendislik Fakültesi
  • Elektrik Elektronik Mühendisliği | Electrical and Electronics Engineering
  • MF, EEM, Bildiri ve Sunum Koleksiyonu
  • View Item
  •   DSpace@MEF
  • Fakülteler
  • Mühendislik Fakültesi
  • Elektrik Elektronik Mühendisliği | Electrical and Electronics Engineering
  • MF, EEM, Bildiri ve Sunum Koleksiyonu
  • View Item
JavaScript is disabled for your browser. Some features of this site may not work without it.
Advanced Search

Turkish Broadcast News Transcription Revisited

Thumbnail

View/Open

Konferans Dosyası (165.2Kb)

Access

info:eu-repo/semantics/closedAccess

Date

2018

Author

Arısoy, Ebru
Saraçlar, Murat

Metadata

Show full item record

Citation

Arısoy, E., ve Saraçlar, M. (2018). Türkçe haber programları için konuşma tanımanın tekrar gözden geçirilmesi. In Proceedings of the IEEE 28. Sinyal İşleme ve İletişim Uygulamaları Konferansı (SİU), Çeşme, İzmir, Turkey.

Abstract

Bu çalışmada yaklaşık on yıl önce gerçeklenen Türkçe haber programları için otomatik konuşma tanımayla yazılandırma sistemi güncel yöntemlerle yenilenerek aynı veri üzerindeki başarımı ölçülmüştür. Son yıllarda yapay sinir ağları temelli derin öğrenme yöntemleri konu¸sma tanıma hata oranlarında belirgin bir iyileşme sağlamıştır ve günümüzde yaygın olarak kullanılmaktadır. Bu bildiride geliştirilen konu¸sma tanıma sisteminin temel bileşenleri olan akustik ve dil modelleri için sinir ağları kullanılmıştır. Akustik modelleme için derin sinir a^gları hem çapraz entropi hem de ayırıcı dizi amaç işlevleriyle eniyilenmiştir. Ayrıca uzun süreli bağımlılıkları modellemek için yinelemeli sinir ağlarına benzer bir başarım gösteren ama daha çabuk eğitilebilen zaman gecikmeli sinir ağları kullanılmıştır. Daha sonra bunların ayırıcı eğitimle eniyilenmesi sonucunda en düşük hata oranlarına ulaşılmoştır. Dil modeli için ise yinelemeli sinir ağları kullanılmıştır. Bu yeni sinir ağları kullanan modeller ile kelime hata oranlarının yarılandığıve %10’un altına düştüğü gözlemlenmiştir.
 
Abstract—In this study a decade old automatic speech recognition system for Turkish broadcast news transcription is revisited and updated with the latest methods. Recently deep learning using artificial neural networks resulted in significant improvements in speech recognition error rates and became the state-of-the-art. Neural network based acoustic and language models are used as the main components of the speech recognition system built in this paper. For acoustic modeling, deep neural networks are optimized using both cross-entropy and sequence discriminative objective functions. In addition, time-delay neural networks are used for modeling long term dependencies with similar performance to recurrent neural networks. The lowest error rates are obtained using discriminatively trained versions of these models. For the language model a recurrent language model is used. It was observed that the word error rates are approximately halved and fell below 10%.
 

Source

The IEEE 28. Sinyal İşleme ve İletişim Uygulamaları Konferansı

URI

https://hdl.handle.net/20.500.11779/984

Collections

  • Araştırma Çıktıları, WOS İndeksli Yayınlar Koleksiyonu [433]
  • MF, EEM, Bildiri ve Sunum Koleksiyonu [27]



DSpace software copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback
Theme by 
@mire NV
 

 




| Instruction | Guide | Contact |

DSpace@MEF

by OpenAIRE

sherpa/romeo

Browse

All of DSpaceCommunities & CollectionsBy Issue DateAuthorsInstitution AuthorTitlesORCIDSubjectsTypeLanguageDepartmentCategoryPublisherAccess TypeThis CollectionBy Issue DateAuthorsInstitution AuthorTitlesORCIDSubjectsTypeLanguageDepartmentCategoryPublisherAccess Type

My Account

LoginRegister

Statistics

View Google Analytics Statistics

DSpace software copyright © 2002-2015  DuraSpace
Contact Us | Send Feedback
Theme by 
@mire NV
 

 


|| Guide|| Instruction || Library || MEF University || OAI-PMH ||

MEF University Library, İstanbul, Turkey
If you find any errors in content please report us

Creative Commons License
MEF University Institutional Repository is licensed under a Creative Commons Attribution-NonCommercial-NoDerivs 4.0 Unported License..

DSpace@MEF:


DSpace 6.2

tarafından İdeal DSpace hizmetleri çerçevesinde özelleştirilerek kurulmuştur.