Home Page Title Page Contents Spectral clustering of Big Data in genetics: applications to RNA-seq data Tsvetelin Zaevski, Ognyan Kunchev, Dean Paleje
|
|
- Руска Холевич
- преди 4 години
- Прегледи:
Препис
1 Spectral clustering of Big Data in genetics: applications to RNA-seq data Tsvetelin Zaevski, Ognyan Kunchev, Dean Palejev, Eugenia Stoimenova Institute of Mathematics and Informatics, Bulgarian Academy of Sciences Page 1 of септември 2017 г.
2 Page 1 of 16 Обща схема на спектралната клъстеризация: 1. Нека W R n n със стойности w ij, където n е броят на елементите, е съответната матрица на подобие. Нека също d i = w ij и D е диагоналната матрица, j=1,...,n конструирана чрез d i. Нека k е броят на клъстерите. 2. Изчисляваме Лапласиана L = D W. 3. Намираме първите k собствени вектора u 1,..., u k на L. 4. Нека U R n k е матрицата конструирана от векторите u 1,..., u k като колони. 5. Нека y i R k, for i = 1,..., n, е съответният i-ти ред на U. 6. Клъстерираме точките y i, i = 1,..., n, в k клъстера, C 1, C 2,..., C k, използвайки k-means algorithm. 7. Клъстерите, A 1, A 2,..., A k, на първоначалните дани се получават чрез A i = {j, y j C i }.
3 Мишките на Bottomly: мишки 10 от тях са здрави, а 11 болни гена, 8824 от тях имат изразяване повече от Има много методи, които разделят гените на важни и неважни. Page 2 of
4 Page 3 of Поставяме очкваните важни и неважни гени като две отделни множества 2. Генерираме корелациони матрици една чрез използване на (2, 2) бета разпределение и друга с параметри (2, 5). 3. Заменяме първоначалната корелационна матрица с генерираната. За всеки важен ген изчисляваме коефициент, който е сумата от квадратите на корелационните коефициенти между него и всички неважни гени. Използваме същото за неважните гени. 4. Има някои неважни гени, които имат много малка корелация с останалите (по малка от 0.03). Тези гени ги поставяме близо до неважните. 5. Избираме различни нива на значимост l = 0.6; 0.7; 0.8; 0.9; 0.98 и променяме корелационната матрица. 6. Матрицата на подобие (1) евклидово разстояние за важните гени и (2) модифицираната корелационна матрица за останалите разстояния.
5 Page 4 of 16 Резултати използваме четири модела. Важните гени варират от 470 до Броят на важните гени след клъстеризацията за бета разпределение (2, 2) варира между и 3417 за модела на Anders and Huber (2010), и 3753 за модела на Robinson et al. (2010), и 3655 за модела на Ritchie et al. (2015), и 3844 за модела на M.I. Love and Anders (2014).
6 Броят на важните гени след клъстеризацията за бета разпределение (2, 5) варира между Page 5 of и 817 за модела на Anders and Huber (2010), и 1322 за модела на Robinson et al. (2010), и 1180 за модела на Ritchie et al. (2015), и 1464 за модела на M.I. Love and Anders (2014).
7 1. Нека M е множеството от важните гени (след клъстерирането). 2. Нека M 1 е множеството от тези важни гени, които преди клъстерирането не са били важни. 3. Нека N е множеството от неважните гени. Следните две неравенства са верни те обясняват математическата логика на алгоритъма. Page 6 of 16 min {max { C (M, M 1 ) }} > l max {max { C (M, N) }} < l където l е нивото на значимост. Това означава, че (1) 1. За всеки важен ген, за който първоначално сме мислели, че не е важен, съществува поне един друг важен ген, такъв че корелацията между двата е по-голяма от нивото на значимост l. 2. За всеки неважен ген няма нито един важен, такъв че корелацията между тях e по-голяма от нивото на
8 Beta parameters (2, 2), significant level l = 0.6 important genes Clustered Data (clustered in 0.12s) Page 7 of
9 Beta parameters (2, 2), significant level l = 0.7 important genes Clustered Data (clustered in 0.11s) Page 8 of
10 Beta parameters (2, 2), significant level l = 0.8 important genes Clustered Data (clustered in 0.14s) Page 9 of
11 Beta parameters (2, 2), significant level l = 0.9 important genes Clustered Data (clustered in 0.16s) Page 10 of
12 Beta parameters (2, 2), significant level l = 0.98 important genes Clustered Data (clustered in 0.24s) Page 11 of
13 Beta parameters (2, 5), significant level l = 0.6 important genes Clustered Data (clustered in 0.15s) Page 12 of
14 Beta parameters (2, 5), significant level l = 0.7 important genes Clustered Data (clustered in 0.12s) Page 13 of
15 Beta parameters (2, 5), significant level l = 0.8 important genes Clustered Data (clustered in 18.85s) Page 14 of
16 Page 15 of 16 parameters Expected important Expected not important Total Imp. Not imp. Total Imp. Not imp. (2,2) (2,2) (2,2) (2,2) (2,2) (2,5) (2,5) (2,5)
17 Page 16 of 16 Литература Simon Anders and Wolfgang Huber. Differential expression analysis for sequence count data. Genome Biology, 11(10):R106+, October ISSN W. Huber M.I. Love and S. Anders. Moderated estimation of fold change and dispersion for rna-seq data with deseq2. Genome Biology, 15(4):550, doi: /s Matthew E. Ritchie, Belinda Phipson, Di Wu, Yifang Hu, Charity W. Law, Wei Shi, and Gordon K. Smyth. limma powers differential expression analyses for RNAsequencing and microarray studies. Nucleic Acids Research, 43(7):e47, April ISSN doi: /nar/gkv007. URL nar/gkv007. Mark D. Robinson, Davis J. McCarthy, and Gordon K. Smyth. edger: a bioconductor package for differential expression analysis of digital gene expression data. Bioinformatics, 26(1): , January ISSN doi: /bioinformatics/btp616. URL bioinformatics/btp616.
Линейна алгебра 11. Собствени стойности и собствени вектори на матрица и линейно преобразувание. Диагонализиране на матрица специалности: Математика,
на матрица и линейно преобразувание. Диагонализиране на матрица специалности: Математика, Бизнес математика, Приложна математика, I курс лектор: Марта Теофилова Собствени стойности и собствени вектори
ПодробноЛинейна алгебра 12. Квадратични форми специалности: Математика, Бизнес математика, Приложна математика, I курс лектор: Марта Теофилова Линейна алгебра
специалности: Математика, Бизнес математика, Приложна математика, I курс лектор: Марта Теофилова Реални квадратични форми Израз от вида f(x 1, x 2,..., x n ) = n i=1 j=1 n a ij x i x j, (1) където x i
ПодробноMicrosoft Word - PMS sec1212.doc
Лекция Екстремуми Квадратични форми Функцията ϕ ( = ( K се нарича квадратична форма на променливите когато има вида ϕ( = aij i j i j= За коефициентите предполагаме че a ij = a ji i j При = имаме ϕ ( =
ПодробноЛинейна алгебра 7. Умножение на матрици. Обратими матрици. Матрични уравнения специалности: Математика, Бизнес математика, Приложна математика, I курс
. Обратими матрици. Матрични уравнения специалности: Математика, Бизнес математика, Приложна математика, I курс лектор: Марта Теофилова Кратка история Матричното умножение е въведено от немския математик
ПодробноIATI Day 1 / Senior Задача Activity (Bulgarian) X INTERNATIONAL AUTUMN TOURNAMENT IN INFORMATICS SHUMEN 2018 При лошо време навън Лора и Боби обичат д
Задача Activity (Bulgarian) При лошо време навън Лора и Боби обичат да се събират и да играят настолни игри. Една от любимите им игри е Activity. В тази задача ще разгледаме обобщение на играта. Играта
ПодробноРекурсия Трифон Трифонов Увод в програмирането, спец. Компютърни науки, 1 поток, спец. Софтуерно инженерство, 2016/17 г. 21 декември 2016 г. 4 януари
Рекурсия Трифон Трифонов Увод в програмирането, спец. Компютърни науки, 1 поток, спец. Софтуерно инженерство, 2016/17 г. 21 декември 2016 г. 4 януари 2017 г. Трифон Трифонов (УП 16/17) Рекурсия 21.12.16
ПодробноICrAData Софтуер за Интеркритериален анализ Николай Икономов 1, Петър Василев 2, Олимпия Роева 2 1 Институт по математика и информатика, БАН nikonomov
ICrAData Софтуер за Интеркритериален анализ Николай Икономов 1, Петър Василев 2, Олимпия Роева 2 1 Институт по математика и информатика, БАН nikonomov@math.bas.bg 2 Институт по биофизика и биомедицинско
ПодробноГОДИШНИК НА УНИВЕРСИТЕТА ПО АРХИТЕКТУРА, СТРОИТЕЛСТВО И ГЕОДЕЗИЯ СОФИЯ Том Volume Брой Issue ANNUAL OF THE UNIVERSITY OF ARCHITECTURE, CIVIL E
ГОДИШНИК НА УНИВЕРСИТЕТА ПО АРХИТЕКТУРА, СТРОИТЕЛСТВО И ГЕОДЕЗИЯ СОФИЯ Том Volume 51 2018 Брой Issue ANNUAL OF THE UNIVERSITY OF ARCHITECTURE, CIVIL ENGINEERING AND GEODESY SOFIA 9 Получена: 22.12.2017
ПодробноMicrosoft Word - Sem02_KH_VM2-19.doc
Семинар Действия с матрици. Собствени стойности и собствени вектори на матрици. Привеждане на квадратична форма в каноничен вид. Матрица k всяка правоъгълна таблица от k-реда и -стълба. Квадратна матрица
ПодробноОсновен вариант, клас Задача 1. (3 точки) За кои n съществуват различни естествени числа a 1, a 2,..., a n, за които сборът е естествено число
Основен вариант, 0. 2. клас Задача. (3 точки) За кои n съществуват различни естествени числа, a 2,..., a n, за които сборът е естествено число? a 2 a 3 + + a n Решение: Ще докажем, че n =, n > 2. При n
ПодробноГОДИШНИК НА УНИВЕРСИТЕТА ПО АРХИТЕКТУРА, СТРОИТЕЛСТВО И ГЕОДЕЗИЯ СОФИЯ Том Volume Брой Issue ANNUAL OF THE UNIVERSITY OF ARCHITECTURE, CIVIL E
ГОДИШНИК НА УНИВЕРСИТЕТА ПО АРХИТЕКТУРА, СТРОИТЕЛСТВО И ГЕОДЕЗИЯ СОФИЯ Том Volume 51 218 Брой Issue ANNUAL OF HE UNIVERSIY OF ARCHIECURE, CIVIL ENGINEERING AND GEODESY SOFIA 2 Получена: 181217 г Приета:
ПодробноСеминар № 2: Граници на редици, признаци на Даламбер и Коши за сходимост на редове
Семинар / 7 Семинар : Парциална сума на числов ред. Метод на пълната математическа индукция. Критерии за сходимост на редове.! Редица (последователност): x, x,, x, x! Ред: x x x...... Числов ред (безкрайна
Подробно31V-B.dvi
МАТЕМАТИКА И МАТЕМАТИЧЕСКО ОБРАЗОВАНИЕ, 2002 MATHEMATICS AND EDUCATION IN MATHEMATICS, 2002 Proceedings of Thirty First Spring Conference of the Union of Bulgarian Mathematicians Borovets, April 3 6, 2002
ПодробноMicrosoft Word - IGM-SER1010.doc
Лекция Редове на Фурие -теория Сведения за пространства със скаларно произведение В този раздел ще се занимаваме с периодични функции с период T > Една функция определена за всяко x R се нарича T -периодична
ПодробноЛекция Многокомпонентен анализ на смеси чрез техните УВ-Вид спектри.. Електронни спектри на смес от вещества. Обикновено UV/Vis спектър на едно вещест
Лекция Многокомпонентен анализ на смеси чрез техните УВ-Вид спектри.. Електронни спектри на смес от вещества. Обикновено UV/Vis спектър на едно вещество се измерва в региона от 200 до 900 nm. За коя да
ПодробноЛогаритмична регресия
Логаритмична регресия Доц. д-р Ивайло Пенев Кат. Компютърни науки и технологии Функция на хипотезата h θ x = g θ T x = 1 1 + e θt x Функция на цената J θ = 1 σ m i=1 m Cost(h θ x i, y i ), където Cost(h
ПодробноMicrosoft PowerPoint - DBoyadzhieva
: Изграждане на висококвалифицирани млади изследователи по съвременни информационни технологии за оптимизация, разпознаване на образи и подпомагане вземането на решения Минимизиране на броя на признаците
ПодробноПримерни задачи за линейни изображения уч. год. Задача 1. В линейното пространство V с базис e 1, e 2, e 3 са дадени векторите a 1 = e 1 +
Примерни задачи за линейни изображения - 21-211 уч год Задача 1 В линейното пространство V с базис e 1, e 2, e 3 са дадени векторите a 1 = e 1 + e 2 + pe 3, a 2 = e 1 + e 2 + (p + qe 3, a 3 = 2e 1 + 3e
Подробноkk7w.dvi
Конкурсен изпит за НПМГ Акад. Л. Чакалов За профил математика 7 юли 2006 година Време за работа 4 астрономически часа. Задача 1. Дадени са изразите A = x 2 810 502 4x 5 и B = ( 100) 251.3. 2006 а) Докажете,
Подробно036v-b.dvi
МАТЕМАТИКА И МАТЕМАТИЧЕСКО ОБРАЗОВАНИЕ, 2010 MATHEMATICS AND EDUCATION IN MATHEMATICS, 2010 Proceedings of the Thirty Ninth Spring Conference of the Union of Bulgarian Mathematicians Albena, April 6 10,
ПодробноMicrosoft Word - Tema-8-klas-PLOVDIV.doc
МИНИСТЕРСТВО НА ОБРАЗОВАНИЕТО И НАУКАТА СЪЮЗ НА МАТЕМАТИЦИТЕ В БЪЛГАРИЯ Пролетен математически турнир 7 9 март 9 г., ПЛОВДИВ Тема за 8 клас Задача. Дадено е уравнението ax + 9 = x + 9ax 8x, където a е
ПодробноСеминар Матрици, детерминанти и система от линейни уравнения (преговор) Задача. Съберете и извадете двете матрици A и B на ръка A B Р
Семинар Матрици детерминанти и система от линейни уравнения (преговор). Съберете и извадете двете матрици и на ръка. Решение: Матрици се събират и изваждат като се събират и изваждат съответните елементи
ПодробноMicrosoft Word - SPSS_CA_3
Клъстерен анализ с SPSS: йерархичен клъстерен анализ Избира се от главното меню последователно Analyze Classify Hierarchical Cluster. Фигура 1. Появява се следния диалогов прозорец: Фигура 2. Маркират
Подробнов общ вид и е напълно приложима и за многомерни системи с малък брой входове и изходи, каквито често се срещат в техниката. Акцент в труда е автоматиз
в общ вид и е напълно приложима и за многомерни системи с малък брой входове и изходи, каквито често се срещат в техниката. Акцент в труда е автоматизирането на процеса на идентификация. Дискутират се
ПодробноСофийски университет Св. Климент Охридски Факултет по математика и информатика Курсов проект по Системи за паралелна обработка Тема: Изобразяване на ф
Софийски университет Св. Климент Охридски Факултет по математика и информатика Курсов проект по Системи за паралелна обработка Тема: Изобразяване на фрактал Mandelbrot set Изготвил: Елена Валентинова Георгиева,
Подробно54. НАЦИОНАЛНА ОЛИМПИАДА ПО МАТЕМАТИКА НАЦИОНАЛЕН КРЪГ Задача 1. Да се намерят всички тройки от естествени числа (x, y, z) такива, че 2005 x + y + 200
54. НАЦИОНАЛНА ОЛИМПИАДА ПО МАТЕМАТИКА НАЦИОНАЛЕН КРЪГ Задача 1. Да се намерят всички тройки от естествени числа (x, y, z) такива, че x + y + 005 x + z + y + z е естествено число. Решение. Първо ще докажем,
ПодробноВариант 1 Писмен Изпит по Дискретни Структури 14/02/2018 г. Оценката се образува по следния начин: 2 + бр. точки, Наредени двойки бележим с ъглови ско
Вариант Писмен Изпит по Дискретни Структури 4/02/208 г. Оценката се образува по следния начин: 2 + бр. точки, Наредени двойки бележим с ъглови скоби, напр., b. Зад.. Намерете: а) (0.25 т.) подмножествата
ПодробноMicrosoft Word - seminar12.docx
Семинар 12 Линеен дискриминантен анализ В този семинар ще се запознаем с линейния дискриминантен анализ (ЛДА), който се използва в статистиката, разпознаването на образи и обучението на машини. От обектите
ПодробноСОФИЙСКА МАТЕМАТИЧЕСКА ГИМНАЗИЯ ТУРНИР ПО МАТЕМАТИКА И ИНФОРМАТИКА "ЗА ТОРТАТА НА ДИРЕКТОРА" ТЕМА ПО МАТЕМАТИКА 8 КЛАС Задача 1. Да се реши в цели чис
СОФИЙСКА МАТЕМАТИЧЕСКА ГИМНАЗИЯ ТУРНИР ПО МАТЕМАТИКА И ИНФОРМАТИКА "ЗА ТОРТАТА НА ДИРЕКТОРА" ТЕМА ПО МАТЕМАТИКА 8 КЛАС Задача 1. Да се реши в цели числа уравнението p( + b) = (5 + b) 2, където p е просто.
ПодробноМодални регулатори на състоянието
Модални регулатори на състоянието инж. Веселин Луков, докторант към катедра Автоматизация на производството I. Възможности за изграждане на системите за управление Система за управление при пълна информация
ПодробноJOHN ATANASOFF SOCIETY OF AUTOMATICS AND INFORMATICS International Conference AUTOMATICS AND INFORMATICS 12 PROCEEDINGS Published by JOHN ATANASOFF SO
JOHN ATANASOFF SOCIETY OF AUTOMATICS AND INFORMATICS International Conference AUTOMATICS AND INFORMATICS 12 PROCEEDINGS Published by JOHN ATANASOFF SOCIETY OF AUTOMATICS AND INFORMATICS Bulgaria, Sofia,
ПодробноГрафика и Презентации - Геометрично Моделиране
Компютърна Графика и ГПИ Геометрично Моделиране. Представящи схеми. Свойства. Математическо пространство. Геометрични преобразования и задачи. доц. д-р А. Пенев Геометрично Моделиране КГиГПИ - Геометрично
ПодробноConverting a regular
ПРИЛАГАНЕ НА DATA MINING ТЕХНИКИ В ЕЛЕКТРОННОТО ОБУЧЕНИЕ доц. д-р Евдокия Сотирова, Университет проф. д-р Асен Златаров, доц. д-р Даниела Орозова - Бургаски свободен университет APPLYING DATA MINING TOOLS
Подробноmunss2.dvi
ОТГОВОРИ И РЕШЕНИЯ 3(x + y)(x xy + y )y(x y) 1. (Б) Преобразуваме: (x y)(x + y)(x + y ) x(x xy + y ) = 3y (x + y)(x y) x = (x + y ) 3 y x y x x + y = 3 y x (x y ) 1 ( x y ) + 1 = 3 ( 3 ) 1 9 3 ( 3 ) +
ПодробноМашинно обучение Лабораторно упражнение 4 Линейна регресия и градиентно спускане Целта на упражнението е да се реализира линейна регресия, в която фун
Машинно обучение Лабораторно упражнение 4 Линейна регресия и градиентно спускане Целта на упражнението е да се реализира линейна регресия, в която функцията на цената се минимизира чрез градиентно спускане.
ПодробноХТМУ Светослав Ненов Навигация Диференчни схеми Начална страница Курсове Математика Диференчни схеми Уравнение на топлопроводимост FTCS схема Настройк
ХТМУ Светослав Ненов Навигация Диференчни схеми Начална страница Курсове Математика Диференчни схеми Уравнение на топлопроводимост FTCS схема Настройки FTCS схема Календар Разглеждаме едномерната задача
ПодробноMicrosoft Word - ProectB.doc
Епидемиологичен модел Целта, към която се стремим тук, е да се изследва как се разпространява заразно заболяване като функция на времето, предизвикано от малка група инфектирани индивиди, намиращи се сред
ПодробноГлава 15 Въпрос 15: Оператор на Рейнолдс. Крайна породеност на пръстена от инвариантни полиноми на крайна матрична група. Навсякъде в настоящия въпрос
Глава 15 Въпрос 15: Оператор на Рейнолдс. Крайна породеност на пръстена от инвариантни полиноми на крайна матрична група. Навсякъде в настоящия въпрос полето k е с характеристика char(k = 0. За произволни
ПодробноЛекция Спектрално и структурно подобие: използване в спектроскопията Спектрални признаци Спектралният признак е число, което се изчислява по определен
Лекция Спектрално и структурно подобие: използване в спектроскопията Спектрални признаци Спектралният признак е число, което се изчислява по определен алгоритъм от спектъра. Например в масспектрометрията
ПодробноHomework 3
Домашно 3 по дисциплината Дискретни структури за специалност Информатика I курс летен семестър на 2015/2016 уч г в СУ ФМИ Домашната работа се дава на асистента в началото на упражнението на 25 26 май 2016
ПодробноНАЦИОНАЛНА ПРИРОДО-МАТЕМАТИЧЕСКА ГИМНАЗИЯ АКАД. Л. ЧАКАЛОВ XXI МАТЕМАТИЧЕСКО СЪСТЕЗАНИЕ,,РИКИ 27 април 2014г. ПРИМЕРНИ РЕШЕНИЯ Задача 1. Да се реши ур
НАЦИОНАЛНА ПРИРОДО-МАТЕМАТИЧЕСКА ГИМНАЗИЯ АКАД. Л. ЧАКАЛОВ XXI МАТЕМАТИЧЕСКО СЪСТЕЗАНИЕ,,РИКИ 7 април 0г. ПРИМЕРНИ РЕШЕНИЯ Задача. Да се реши уравнението ( n. ) ( ), където n е естествено число. ( n n.
ПодробноSlide 1
11. Количествено ориентирани методи за вземане на решения в обкръжение на неопределеност и риск 1 Структура Матрица на полезността Дърво на решенията 2 11.1. Матрица на полезността 3 Същност на метода
ПодробноПроектиране на непрекъснат ПИД - регулатор. Динамичните свойства на системите за автоматично регулиране, при реализация на първия етап от проектиранет
Проектиране на непрекъснат П - регулатор инамичните свойства на системите за автоматично регулиране, при реализация на първия етап от проектирането им, могат да се окажат незадоволителни по отношение на
ПодробноМашинно обучение - въведение
Линейна регресия с една променлива Доц. д-р Ивайло Пенев Кат. Компютърни науки и технологии Пример 1 Данни за цени на къщи Площ (x) Означения: Цена в $ (y) 2104 460 000 1416 232 000 1534 315 000 852 178
Подробно