Вимірювання точності відстеження клітин на основі порівняння ациклічно орієнтованих графіків
Порівну сприяв цій роботі разом з: Павлом Матулою, Мартіном Машкою
Поточна адреса: Ботаніка 68а, 602 00 Брно, Чеська Республіка
Партнерський центр біомедичного аналізу зображень, Факультет інформатики, Університет Масарика, Брно, Чеська Республіка, Відділ молекулярної цитології та цитометрії, Інститут біофізики АН Чеської Республіки, Брно, Чеська Республіка
Порівну сприяв цій роботі разом з: Павлом Матулою, Мартіном Машкою
Партнерський центр біомедичного аналізу зображень, Факультет інформатики, Університет Масарика, Брно, Чеська Республіка
Партнерський центр біомедичного аналізу зображень, Факультет інформатики, Університет Масарика, Брно, Чеська Республіка
Партнерський центр біомедичного аналізу зображень, факультет інформатики, Університет Масарика, Брно, Чеська Республіка
Лабораторія візуалізації приналежності раку, Центр прикладних медичних досліджень, Університет Наварри, Памплона, Іспанія
Партнерський центр біомедичного аналізу зображень, Факультет інформатики, Університет Масарика, Брно, Чеська Республіка
- Павло Матула,
- Мартін Машка,
- Дмитро Васильович Сорокін,
- Петр Матула,
- Карлос Ортіс-де-Солорцано,
- Міхал Козубек
Цифри
Анотація
Цитування: Matula P, Maška M, Sorokin DV, Matula P, Ortiz-de-Solórzano C, Kozubek M (2015) Вимірювання точності відстеження клітин на основі порівняння ациклічно орієнтованих графіків. PLoS ONE 10 (12): e0144959. https://doi.org/10.1371/journal.pone.0144959
Редактор: Томас Абрахам, штат Пенсільванія, медичний коледж Герші, США
Отримано: 25 травня 2015 р .; Прийнято: 26 листопада 2015 р .; Опубліковано: 18 грудня 2015 року
Наявність даних: Усі відповідні дані знаходяться в газеті та в допоміжних файлах. Більше інформації можна знайти тут: www.codesolorzano.com/celltrackingchallenge/.
Фінансування: Цю роботу підтримали Чеський науковий фонд (GA14-22461S Петру Матулі та 13-07822S Павлу Матулі), Європейський соціальний фонд та Міністерство освіти Чехії (CZ.1.07/2.3.00/30.0009 для MM, CZ). 1.07/2.3.00/30.0030 для DVS) та Міністерства економіки та конкурентоспроможності Іспанії (DPI2012-38090-C03-02 для COS). Фінансисти не мали жодної ролі у розробці досліджень, зборі та аналізі даних, прийнятті рішення про публікацію чи підготовці рукопису.
Конкуруючі інтереси: Автори заявили, що не існує конкуруючих інтересів.
Вступ
Наріжним каменем багатьох сучасних експериментів з візуалізації живих клітин є можливість автоматичного відстеження та аналізу рухливості клітин на мікроскопічних знімках із проміжок часу [1, 2]. Відстеження клітин - це важливий крок у розумінні великого розмаїття складних біологічних процесів, таких як імунна відповідь, ембріональний розвиток або пухлина. [3].
Автоматизоване відстеження комірок може бути сформульовано як проблему ідентифікації та сегментування всіх бажаних випадків клітин та опису їх часових взаємозв’язків у часовому інтервалі. Оскільки клітини можуть мігрувати, зазнавати поділу або загибелі клітини, стикатися або входити в поле зору та виходити з них, алгоритм відстеження клітин, придатний для щоденної практики, повинен надійно вирішувати всі ці події та забезпечувати структуру даних, яка ретельно характеризує поведінку відстежуваних об’єктів, які можуть бути як цілими клітинами, так і ядрами клітин залежно від застосування.
Ультрасучасні підходи до відстеження клітин можна розділити на дві категорії [4]: відстеження шляхом виявлення [5–9] та відстеження за розвитком моделі [4, 10–13]. Колишня парадигма, як правило, передбачає два етапи. По-перше, алгоритм сегментації клітини або клітинного ядра ідентифікує всі цільові об'єкти у всій серії інтервалів часу окремо для кожного кадру. По-друге, виявлені об'єкти асоціюються між послідовними кадрами, як правило, шляхом оптимізації імовірнісної цільової функції. На відміну від них, остання парадигма вирішує обидва етапи одночасно, як правило, використовуючи або параметричні, або неявні активні контурні моделі.
Незалежно від конкретного використовуваного алгоритму, результати його відстеження можуть бути математично представлені за допомогою ациклічно орієнтованого графіка. Вершини такого графіка відповідають виявленим об'єктам, тоді як його ребра збігаються з часовими зв'язками між ними. Об'єкти, що не діляться, мають щонайменше одного наступника, тоді як ті, що зазнають поділу, мають два і навіть більше наступників у разі ненормального поділу. Результати відстеження ліній клітин, представлені ациклічно орієнтованим графіком, утворюють ліс дерев у термінології теорії графів.
Зі збільшенням числа алгоритмів відстеження стільників існує природний попит на об’єктивні порівняння їх продуктивності. Загалом, існує два аспекти алгоритмів відстеження комірок, які варто оцінити: точність сегментації та точність відстеження. Перший характеризує здатність алгоритму точно визначати пікселі (або вокселі), зайняті об’єктами на зображеннях. Зазвичай це призводить до порівняння опорних та обчислених областей на основі їх перекриття або відстані між їх контурами [14, 15]. Точність відстеження оцінює здатність алгоритму правильно виявляти окремі об'єкти, що цікавлять, і вчасно слідувати за ними.
Існує два популярних підходи до вимірювання точності відстеження. Один із підходів базується на співвідношенні повністю реконструйованих доріжок до загальної кількості наземних доріжок [4, 16]. Другий обчислює відношення правильних часових зв’язків у реконструйованих доріжках до загальної кількості тимчасових зв’язків у межах доріжок земля-істина [16, 17]. Обидва підходи кількісно визначають, у різних масштабах, наскільки алгоритми відстеження клітин здатні реконструювати конкретне посилання на істину землі. Однак вони ні карають виявлення помилкових слідів, ні враховують поділи поділу, які часто оцінюються окремо [4, 16].
Комплексні рамки для оцінки ефективності алгоритмів виявлення та відстеження були встановлені в області комп'ютерного зору [18]. Тим не менше, він націлений лише на топологічно стабільні об'єкти, такі як людські обличчя, текстові поля та транспортні засоби. Тому його не можна застосовувати до програм відстеження клітин, оскільки відстежувані об’єкти можуть з часом поділитися або зникнути після загибелі клітини. Подібним чином, інша система оцінки [19], створена для порівняння ефективності методів відстеження частинок, не враховує поділи поділу, виключаючи її здатність оцінювати правильну реконструкцію лінії клітин.
У цій роботі ми пропонуємо міру точності відстеження, яка карає всі можливі помилки в результатах відстеження та агрегує їх в єдине значення. Міра оцінює складність перетворення обчислюваного ациклічно орієнтованого графіка в задане посилання на грунтову істину. Така складність вимірюється як зважена сума найменшої кількості графічних операцій, необхідних для того, щоб зробити графіки однаковими.
Запропонована міра може служити не тільки розробникам алгоритмів, але й аналітикам з метою вибору найбільш підходящого алгоритму та налаштування його параметрів щодо всіх подій відстеження шляхом оптимізації одного критерію. Типовий сценарій полягає у створенні грунтової істини та оцінці перспективних алгоритмів на частині даних зображення, і дозволяють найбільш придатному алгоритму працювати на решті. Альтернативний спосіб порівняння продуктивності алгоритмів без необхідності грунтової істини був запропонований нещодавно в [20, 21]. Однак цей підхід створює рейтинг на основі попарного порівняння алгоритмів, і тому абсолютна ефективність алгоритмів залишається невідомою.
Матеріали та методи
Запропонована точність відстеження клітин вимірюється неофіційно
Основною метою пропонованого заходу є оцінка здатності алгоритмів відстеження клітин виявляти всі бажані об'єкти і вчасно слідувати за ними. Хоча воно безпосередньо не оцінює точність сегментованих областей, надійне виявлення об'єктів є дуже важливим фактором і в цьому вимірі.
Фактично, міра підраховує кількість усіх виявлення, а також помилки прив'язки, допущені алгоритмом. Він підраховує кількість пропущених об'єктів (FN - помилкові негативи), кількість зайвих виявлених об'єктів (FP - помилкові спрацьовування) та кількість пропущених поділів (необхідних для правильного сегментування кластерів, NS). Отримавши ці три числа помилок, ми можемо згрупувати їх в одне число у вигляді зваженої суми wNS NS + wFN FN + wFP FP з невід’ємними вагами wNS, wFN та wFP. Здатність алгоритму правильно визначати часові взаємозв'язки між об'єктами оцінюється шляхом підрахунку кількості помилок при зв'язуванні об'єктів. А саме, він підраховує кількість відсутніх посилань (EA), кількість зайвих посилань (ED) та кількість посилань з неправильною семантикою (EC). Ці числа знову агрегуються в одне число у вигляді зваженої суми wEA EA + wED ED + wEC EC з невід’ємними вагами wEA, wED та wEC. Вагові коефіцієнти є покаранням за окремі типи помилок і можуть, наприклад, відображати ручні зусилля, необхідні для виправлення помилок у певному програмному забезпеченні.
Кількість допущених помилок можна розрахувати, підрахувавши різниці між посиланням на земну істину та обчисленим результатом, де кожна з них може бути математично представлена ациклічно орієнтованим графіком. З точки зору обчислень, критичною частиною запропонованого міри є існування унікального способу поєднання посилань та обчислюваних об'єктів (тобто вершин графіка). З цією метою ми поєднуємо еталонний об'єкт з обчислюваним тоді і тільки тоді, коли останній охоплює більшість першого, що гарантує унікальність встановленого сполучення і, отже, прямі обчислення без будь-якої оптимізації. Цікаво, що такого простого тесту не існує для проблеми відстеження частинок, коли частинки вважаються безрозмірними, що робить подібну процедуру оцінки обчислювально нездійсненною.
В решті цього розділу представлена основна термінологія та позначення, необхідні для встановлення зв'язку між результатами відстеження ліній клітин та ациклічно орієнтованими графіками, а пропонований показник формально визначений.
Основна термінологія та позначення
Будь-яка четвірка може бути безпосередньо перетворена в ациклічно орієнтований графік G = (V, E), де набір вершин V складається з усіх маркерів, що присутні в доріжках θi ∈ Θ, а набір орієнтованих ребер E ⊂ V × V представляє часові співвідношення між маркери. Точніше, пара є ребром графіка G тоді і лише тоді, коли або i = j ∧ t2 = t1 + 1, або. У першому випадку ребро з'єднує два послідовних маркери в межах однієї доріжки, тоді як кінцевий маркер θi пов'язаний з початковим маркером θj в останньому випадку. Далі ми називаємо перший край посиланням на трек, а другий - батьківським посиланням. Над набором ребер E ми визначаємо функцію, що описує семантику ребра e ∈ E як для посилань на доріжку, так і для батьківських посилань. Зверніть увагу, що орієнтація країв слідує за висхідним тимчасовим упорядкуванням маркерів всередині, а також між доріжками, що забезпечує ациклічність графіка G. Приклад графіка G зображений на рис. 1.
- Ліполіз жирових клітин і приріст ваги в майбутньому
- Кокону Вода та схуднення Науково обґрунтований довідник
- Мешканець Глендейла, який написав книгу про схуднення, засновану на біблійних принципах, щоб з’явитись у Бербанку -
- Порівняння занурення в гарячу воду на 37
- Порівняння різних обробних процедур дезінфекції поверхонь об'єктів питної води з