ÏÐÈËÀÃÀÍÅ ÍÀ ÒÅÕÍÎËÎÃÈßÒÀ ÍÀ HTML5 ÇÀ ÏÐÅÄÑÒÀÂßÍÅ ÍÀ ÀÓÄÈÎ È ÒÐÀÍÑÊÐÈÏÖÈß qíà ÐÀÇÃÎÂÎÐÍÀ ÐÅ

Подобни документи
ИЗИСКВАНИЯ ЗА ДОКЛАДИТЕ А. ОБЩИ ИЗИСКВАНИЯ І. Докладът трябва да е написан на компютърна програма Microsoft Word. ІІ. Файлът да бъде записан като *.do

Стилове в интернет страници

ЕДИС СОФТУЕР ЕООД Пловдив, тел , ЕДИС-АСО ИЗТЕГЛЯНЕ И ИНСТАЛИРАНЕ НА АКТУАЛИЗАЦИЯТ

УНИВЕРСИТЕТ ЗА НАЦИОНАЛНО И СВЕТОВНО СТОПАНСТВО ЦЕНТЪР ЗА ДИСТАНЦИОННО ОБУЧЕНИЕ Ръководство за работа с web Студент и системата за електронно обучение

ЕВРОПЕЙСКИ СЪЮЗ Европейки фонд за регионално развитие Инвестираме във вашето бъдеще ОПЕРАТИВНА ПРОГРАМА Развитие на конкурентоспособността на българск

ПРОГРАМНО ОСИГУРЯВАНЕ НА КОМПЮТЪРА

Видеорекордер АHD-3908 Ръководство за експлоатация Моделите от тази серия са отличен избор за цифрово наблюдение на обекти в различни сфери, където во

Microsoft Word - Techn zad 2017-M1

НАУЧНИ ТРУДОВЕ НА РУСЕНСКИЯ УНИВЕРСИТЕТ , том 49, серия 3.2 Един подход за обработка и конвертиране на векторни изображения в WEB-базираните сис

Услуга Web Presence Описание на услугата Версия: 4.0 Май 2018 Страница 1 от 7

ТЕХНОЛОГИЧНО РЕШЕНИЕ ЗА ПОДПОМАГАНЕ И РЕАЛИЗИРАНЕ НА ЕЛЕКТРОННОТО ОБУЧЕНИЕ В ЛЕСОТЕХНИЧЕСКИ УНИВЕРСИТЕТ

DOT NET 3.1

УКАЗАНИЯ

Scan Tailor Кратко ръководство за работа Преди време описах как се работи с програмата Scan Kromsator. Сега искам да Ви представя една друга програма,

Russian for Tourism РЪКОВОДСТВО ЗА ИЗПОЛЗВАНЕ НА ИНДИВИДУАЛНОТО ПРОСТРАНСТВО НА ПРОЕКТА RETOUR По-долу ще намерите някои технически указания, които ще

ICS Natioanal

Десислава Цокова ЗАБАВНИ ОБУЧИТЕЛНИ ИГРИ С LEARNING APPS НЕОБХОДИМИ РЕСУРСИ Компютър, интернет за създаването и ползването им. Регис

AM_Ple_LegReport

РЕЦЕНЗИЯ от проф. д-р Красен Стефанов Стефанов на дисертационен труд на тема ИНСТРУМЕНТИ ЗА ПРЕДСТАВЯНЕ НА 3D ОБЕКТИ И КОЛЕКЦИИ В ИНТЕРНЕТ за придобив

Информатика

Изследване на строежа и съответствието между формите на музика, слово и движения в упражнението Колко сме доволни Следователно, щом дойде Светлината,

CSRF on JSON data

Представяне на бази данни Образование и Неправителствени организации Ролята на нашата библиотека като информационен център се разширява непрекъснато,

Microsoft Word - Primer3_1.doc

Указание за инсталиране на офлайн Модул за Интрастат оператора (МИО) версия за 2019 г. Последна актуализация на указанието: г. Препор

СТАНОВИЩЕ на дисертационен труд за получаване на образователната и научна степен доктор на тема: АКУСТИЧНО-ФОНЕТИЧНО МОДЕЛИРАНЕ ЗА РАЗПОЗНАВАНЕ НА ДЕТ

2018 г. Какво ново в Е-либ Прима?

Термограф Cargo Log Master Ръководство за работа и настройки през WiFi, V1.0 Включете захранването със задържане на бутон Power. Следва начална анимац

PowerPoint Presentation

Microsoft Word - Reglament_2018_IT-Sofia

Редовно обучение, бакалавърска степен УЧЕБЕН ПЛАН: Българска филология УЧЕБНА ДИСЦИПЛИНА А Л С У Е О КР Ф І курс, І семестър Аудиовизуални и информаци

9-P550S UM (BULGARIAN)

Годишното тематично разпределение по Компютърно моделиране за 4. клас N седмица Тема очаквани резултати Методи бележки и коментари Първи учебен срок Т

РЕЦЕНЗИЯ от проф. д-р Красен Стефанов Стефанов на дисертационен труд на тема Оперативна съвместимост между цифрови библиотеки за културно наследство з

РЪКОВОДСТВО ЗА РАБОТА С ЕЛЕКТРОННА ПЛАТФОРМА ЗА ТЪРСЕНЕ И ПРЕДЛАГАНЕ НА ЗАНИМАНИЯ ПО ИНТЕРЕСИ НОВО: За учебната година в електронната платфо

ПЛОВДИВСКИ УНИВЕРСИТЕТ ПАИСИЙ ХИЛЕНДАРСКИ График за провеждане на държавни изпити и защити на дипломни работи през календарната 2019 г. към Филологиче

“ Ада – софт “ – софтуер за автоматизиране на финансово – счет

НАУЧНИ ТРУДОВЕ НА РУСЕНСКИЯ УНИВЕРСИТЕТ , том 51, серия 4 Методика за изследване изпреварването между автомобили с помощта на GPS приемници Свил

Инструкция за инсталация на EXTRADE BOUTIQUE Ако на Вашия компютър е инсталирана по-ранна Windows 7 или по-ранна версия, моля пропуснете стъпка Предва

Full HD камера в настолен часовник с датчик за движение: инструкция за експлоатация - SPY.BG

Sem 6

Съюз на математиците в България - секция Варна гр. Варна, кв. Победа, ул. "Академик Андрей Сахаров" 15, партер, офис 4а, ел.поща:

Препис:

ÏÐÈËÀÃÀÍÅ ÍÀ ÒÅÕÍÎËÎÃÈßÒÀ ÍÀ HTML5 ÇÀ ÏÐÅÄÑÒÀÂßÍÅ ÍÀ ÀÓÄÈÎ È ÒÐÀÍÑÊÐÈÏÖÈß qíà ÐÀÇÃÎÂÎÐÍÀ ÐÅ Õåòèë Ðî Õàóãå (Îñëî, Íîðâåãèÿ) HTML5, нов стандарт за уеб страници, предлага нови възможности за представяне на транскрибирана устна реч: потребителят може да премине директно от произволна реплика в транскрипцията към съответното място в аудио файла. Изработването на подобни страници е сравнително трудоемко, но може да се прави с безплатни програмни продукти. HTML5 е най-новият вариант на HTML, езикът за описание на уеб страници и други форматирани документи (W3C 2011). Този стандарт на уеб страници предоставя нови възможности за интегриране на текст с аудио и видео и следователно за представяне на елементи от устната комуникация. Това се прави с помощта на прости процедури за предаване на аудио и видео за сравнение при предишните стандарти са необходими сравнително сложни структури при програмирането на страницата, както и инсталиране на plugin като QuickTime, Flash, Silverlight или др. от страна на потребителя. Стандартът е все още в процес на подготовка и не всички браузъри го поддържат: Internet Explorer само след версия 9, Firefox след версия 7, Google Chrome след версия 15 и Safari след версия 5. Кои приложения на тази технология могат да бъдат интересни за изследователите на устната комуникация? HTML5 дава възможност за създаване на уеб страници, които комбинират текст с аудио или видео с хиперлинкове директно от даден ред в текста към съответното място в аудиото или видеото. В илюстрираната от фиг. 1 26

демонстрационна програма (Хауге 2011а), направена за проекта BGSpeech (изследователска група за изследване на устната комуникация, Софийски университет), кликване върху дадено изречение в дясната колона пренасочва плейъра отляво към съответното място в аудиото (едновременно същото изречение се изписва като субтитри към плейъра). [Фиг. 1, bgspeech.jpeg, тук] Тази функционалност се извършва с помощта на Javascript библиотеки, които се намират на уеб сървъра. Плейърът е jplayer (http://jplayer.org/) и връзката между пълния текст и видеото със субтитрите се осъществява от popcorn.js (http://popcornjs.org/). Демонстрационната програма, направена за BGSpeech, е минимален модел възможно е да се направят още рамки на уеб страницата с текст, който се променя динамично, следвайки аудиото или видеото, например с научен коментар. За добри резултати е необходимо да се направи ръчно кодиране на съответствията между текста, от една страна, и аудиото или видеото, от друга страна. Записът трябва да се прослуша в реално време и при всяко ново изречение да се регистрира времевата точка на сегмента (обикновено с кликване на дадено копче в програмния продукт). Удобен програмен продукт за тази цел е EXMARaLDA (Extensible Markup Language for Discourse Annotation, безплатна програма, http://www.exmaralda.org/). EXMARaLDA предлага експортиране в XML - разпространен стандарт за структуриране на текст. Съществуват безплатни редактори за XML за найразпространените компютърни платформи, например EditX Lite (http:/ /free.editix.com/). В представената по-долу част от файл от демонстрационната програма за BGSpeech стойностите T2, T3,... са разстоянията в секунди от дадено начало, при които се сменят говорни "събития" (events). При самите събития, т.е. транскрипцията, във втората част от файла, са отбелязани началната и крайната точка като препращания към списъка на T-стойности. <tli id="t2" time="5.986665105894844"/> <tli id="t3" time="13.839995407747294"/> <tli id="t4" time="15.839995407747294"/> 27

[...] <event start="t2" end="t3">изпит (.) и че нямa верни и грешни отговори още повече че (.) специално за тематиката която ше говориме днеска ъ_ъ_ъ </event> <event start="t3" end="t4">(.) със сигурност вие сте по-компетентни </event> С помощта на така наречени XSL-трансформации (опция в редактор за XML) XML-структури могат да бъдат конвертирани в: чист текст, HTML, други XML-структури, или javascript. В посоченотата демонстрационна програма дисплеят с пълния текст се записва в HTML и "събитие" от горния пример изглежда така: <p><span m= "5987">Ясен [v] : изпит (.) и че нямa верни и грешни отговори още повече че (.) специално за тематиката която ше говориме днеска ъ_ъ_ъ</span> За целите на представяне на отделните изречения в плейъра същото изречение е записано в javascript по следния начин:.subtitle({ start: 5.986665105894844, end: 13.839995407747294, text: "Ясен [v]: изпит (.) и че нямa верни и грешни отговори още повече че (.) <b>специално</b> за тематиката която ше говориме днеска ъ_ъ_ъ ", Интересна идея е, че успоредяването на текст и аудио може да се прави автоматично, ако условно се приеме, че всяко изречение заема толкова голям относителен дял в аудиото, колкото в писмената транскрипция. От само себе си се разбира, че по такъв начин няма да се получи точността на ръчното кодиране. Но дали точността ще е достатъчна за ориентир, ако не за представителни цели пред публика, то поне за изследователски цели, когато се обработва аудио в по-голям размер, например около час или повече, с транскрипция, а без кодиране? Донякъде е предимство, ако графичната система на даден език отразява една фонема само с една графема както e горе-долу в български, руски, чешки, фински, за разлика например от полски, 28

английски и скандинавските езици. По-добре е аудиото да бъде "равномерно" не дискусия или разговор, а в оптималния случай спокоен монолог. Като предварителна подготовка за такъв процес аудиото трябва да бъде обработено, като се отстранят паузите в двата края, както и елементи, които не присъстват в текста. И обратно, в текста трябва да бъдат отстранени елементи, които не се срещат в аудиото. Текстът се сегментира на изречения, например с общодостъпната програма за разделяне на изречения на проекта за паралелен германско-романско-славянски корпус при Университета в Осло (Orekhov б.г). След това "формалното" успоредяване на транскрипцията на час или два часа запис се изчислява за секунди с AppleScript на платформата Macintosh. Подобни резултати могат да се постигнат с Perl на други платформи. Най-добрият постигнат резултат е с повестта на Франц Кафка, In der Strafkolonie (В наказателната колония, Хауге 2011б). Аудиото, записано от доброволец, приносител на librivox.org, e 69 минути и 30 секунди (броячът на плейъра jplayer започва броенето отново от всеки час и показва 09.30 минути на посочената страница) и попаденията обикновено са +/- едно до две, понякога три изречения. В по-реалистичен пример от устната комуникация, актуално интервю, 2 минути и 45 секунди, в сутрешния блок на полското радио, (Хауге 2011в), попаденията стават по-неточни към края на записа. Участниците обаче говорят много бързо и оживено и резултатите може би биха били по-добри при по-формална или по-спокойна устна комуникация. ÁÈÁËÈÎÃÐÀÔÈß Хауге 2011а: Hauge, Kjetil Rå. Фокус група.// http://folk.uio.no/kjetilrh/ bgspeech/fokus-grupa.html. Хауге 2011б: Hauge, Kjetil Rå. Automatisk parallellstilling av tekst og audio.// http://folk.uio.no/kjetilrh/wkshop/kafka/inderstrafkolonie.html. Хауге 2011в: Hauge, Kjetil Rå. Polsk intervju.// http://folk.uio.no/kjetilrh/ pol/popcorn/ intervju.html. Orekhov б.г.: Orekhov, Boris. RuN Project Tools Page.// http://nevmenandr.net/run/tools/. 29

W3C 2011: HTML5: A vocabulary and associated APIs for HTML and XHTML. W3C Working Draft 25 May 2011.// http://www.w3.org/tr/2011/wdhtml5-20110525. APPLYING HTML5 TECHNOLOGY FOR DISPLAYING AUDIO AND TRANSCRIBED SPOKEN LANGUAGE Kjetil Rå Hauge (Oslo, Norway) Abstract: HTML5, a new web standard, opens new possibilities for displaying transcribed spoken language: the user may jump directly from any turn in the transcript to the appropriate place in the audio. Preparing pages for this purpose is relatively time-consuming, but may be done with freely available computer programs. 30