genetico

Сырые данные секвенирования

18 июля 2024 г
Our Score
6 минут

Содержание:


Путь к персонализированной медицине и передовым генетическим исследованиям начинается с необработанных данных секвенирования. Этот фундаментальный элемент служит краеугольным камнем для понимания генетического кода отдельных людей и популяций, что позволяет совершать прорывы в диагностике, лечении и профилактике генетических нарушений.

Секвенирование — это передовой лабораторный метод, используемый для определения точной последовательности нуклеотидов (основных компонентов ДНК) в образце генетического материала. Этот процесс расшифровывает генетическую информацию, закодированную в ДНК организма, предоставляя полную картину о его генетическом составе.

Существует несколько типов технологий секвенирования, каждая из которых предлагает уникальные преимущества. В клинической практике наиболее часто используется секвенирование нового поколения (NGS). Этот современный подход включает различные платформы, такие как Illumina, PacBio и Oxford Nanopore. NGS позволяет одновременно анализировать целые геномы или большие наборы генов, что делает его идеальным для комплексных генетических исследований.

Что такое сырые данные секвенирования?

Сырые данные секвенирования — это первоначальные результаты, полученные с помощью технологий секвенирования следующего поколения (NGS). Они представляют собой последовательности нуклеотидов (аденин (А), гуанин (Г), цитозин (Ц), тимин (Т)), которые составляют первичную структуру ДНК человека. Поскольку весь геном человека состоит из более чем трех миллиардов нуклеотидов, данные секвенирования производятся в больших объемах, часто достигая гигабайтов или терабайтов информации в зависимости от объема проекта.

Объем данных секвенирования может различаться в зависимости от типа секвенирования: полногеномное (WGS) и полноэкзомное (WES).

При полногеномном секвенировании (WGS) секвенируется весь геном, включая все кодирующие и некодирующие области ДНК. Этот метод обеспечивает комплексное представление всей генетической структуры, охватывая все вариации, включая регуляторные и межгенные регионы. WGS идеально подходит для комплексных генетических исследований, выявления редких генетических вариантов и изучения сложных заболеваний.

Полноэкзомное секвенирование (WES) фокусируется только на экзонах — кодирующих белок участках генома, которые составляют около 1-2% всего генома. Этот метод нацелен на регионы, которые с наибольшей вероятностью содержат мутации, вызывающие заболевания. WES эффективен для диагностики генетических нарушений, выявления мутаций, вызывающих заболевания, и проведения целевых исследований генов, кодирующих белки.

Как генерируются сырые данные секвенирования?

  1. Подготовка проб. Процесс начинается с выделения ДНК из биологических образцов, таких как кровь, слюна или ткань.
  2. Создание библиотеки. Извлеченный генетический материал фрагментируется на более мелкие части. К фрагментам присоединяют адаптеры (короткие последовательности ДНК) для создания библиотеки, которую может распознать секвенатор.
  3. Секвенирование. Подготовленную библиотеку загружают на платформу секвенирования, например, Illumina, PacBio или Oxford Nanopore, где фрагменты считываются и преобразуются в цифровые последовательности.
  4. Вывод данных. Платформа секвенирования генерирует файлы сырых данных, обычно в формате FASTQ, которые содержат нуклеотидные последовательности и показатели качества.

Важность сырых данных секвенирования

  1. Основа для анализа. Сырые данные секвенирования являются отправной точкой для всех последующих биоинформатических анализов, таких как выравнивание, идентификация вариантов и функциональная аннотация.
  2. Качество и целостность данных. Обеспечение высокого качества и целостности сырых данных секвенирования критично для точной генетической интерпретации. Высококачественные данные сводят к минимуму ошибки и ложные результаты, что обеспечивает более надежные выводы.
  3. Универсальность. Сырые данные секвенирования можно использовать для широкого спектра задач: от выявления генетических мутаций и изучения наследственных заболеваний до изучения микробного разнообразия, и изучения эволюционной биологии.

Обработка и интерпретация необработанных данных секвенирования

Преобразование сырых данных секвенирования в значимые генетические сведения включает в себя несколько ключевых шагов:

  1. Предварительная обработка данных. Включает меры контроля качества, такие как удаление адаптерных последовательностей и последовательностей с низким качеством для обеспечения чистоты и надежности данных.
  2. Выравнивание. Очищенные последовательности выравниваются по эталонному геному, чтобы определить точное положение каждой нуклеотидной последовательности. Длина таких последовательностей колеблется от 150 нуклеотдидов до нескольких десятков тысяч нуклеотидов, в зависимости от платформы секвенирования.
  3. Идентификация вариантов. Выявляются различия между секвенированным и эталонным геномом, что подчеркивает потенциальные генетические варианты, связанные с заболеваниями или признаками.
  4. Аннотация и интерпретация. Варианты сопровождаются функциональной информацией, связывающей их с известными генами, путями и клинической значимостью.

Секвенирование обнаруживает широкий спектр генетических заболеваний, включая как редкие, так и распространенные состояния. Оно эффективно выявляет мутации, ответственные за такие заболевания, как муковисцидоз, фенилкетонурия, мышечная дистрофия Дюшенна и различные виды рака, вызванные генетическими факторами.

Однако, и у этих методов есть ограничения. Секвенирование генома/экзома не может покрыть 100% обследуемой ДНК, но при качественных данных этот показатель приближается к 100. Длина прочтений также влияет на возможность выявления генетических вариантов, чем длиннее синтезируемый фрагмент, тем больше метод подходит для идентификации крупных хромосомных перестроек.

Также в зависимости от платформы некоторые типы генетических вариантов хуже поддаются выявлению методом NGS секвенирования. В случае платформы  Illumina это структурные изменения хромосом (инверсии, транслокации, делеции), полиплоидия, анэуплоидия, протяженные участки триплетных и других повторов, варианты в генах с наличием в геноме близкого по последовательности псевдогена или паралога, варианты в GC-богатых участках. Метод имеет ограниченную чувствительность в отношении вариантов в состоянии мозаицизма. Чувствительность и специфичность обнаружения вариантов, находящихся в областях сегментарных дупликаций, могут быть низкими. Эпигенетические варианты не поддаются выявлению с помощью данного метода.

Полногеномное секвенирование предоставляет наиболее полную генетическую информацию путем анализа всего генома, что позволяет лучше диагностировать и разрабатывать персонализированные стратегии лечения для людей, страдающих наследственными заболеваниями.

Консультация врача-генетика в Genetico
Консультация врача-генетика онлайн и очно

Перейти

Список используемой литературы:

  1. Caspar S. M. et al. Clinical sequencing: from raw data to diagnosis with lifetime value //Clinical genetics. – 2018. – Т. 93. – №. 3. – С. 508-519.
  2. Vinkšel M. et al. Improving diagnostics of rare genetic diseases with NGS approaches //Journal of Community Genetics. – 2021. – Т. 12. – С. 247-256.
  3. Pereira R., Oliveira J., Sousa M. Bioinformatics and computational tools for next-generation sequencing analysis in clinical genetics //Journal of clinical medicine. – 2020. – Т. 9. – №. 1. – С. 132.

Также, вам может быть интересно

Untitled(14)

Сравнительная геномная гибридизация на чипах

Сравнительная геномная гибридизация на чипах (aCGH) — молекулярно-цитогенетический метод, используемый для обнаружения вариаций числа копий генов (CNV) в ДНК человека.
laboratory technician holding a blood tube test labeled with bar / hand of a lab technician holding blood tube test and background a rack of color tubes

Как проводятся генетические тесты и почему так дорого стоят?

Генетические тесты используют не только в судебной экспертизе, криминалистике или для установления родства. Анализ ДНК стал неотъемлемой частью современной медицины. Генетическое тестирование активно используют врачи разных специальностей: кардиологи, пульмонологи, стоматологи и многие другие специалисты.
уууме

Что такое секвенирование?

Под секвенированием подразумевают несколько методов, цель которых — определение нуклеотидной последовательности в ДНК. На данный момент нет ни одного способа, который бы работал для этой макромолекулы целиком.
для сайта 44

Применение NGS-секвенирования в областях медицины

Использование секвенирования генома в персонализированной медицине, в биотехнологии, в вирусологии стало доступным с началом использования метода NGS, next generation sequencing, или Секвенирования нового поколения.
Сырые данные секвенирования


Закрыть








            ОнлайнВ центре



                    Отправляя форму, вы даете согласие на обработку и хранение персональных данных в соответствии с пользовательским соглашением












                        Отправляя форму, вы даете согласие на обработку и хранение персональных данных в соответствии с пользовательским соглашением








                          Отправляя форму, вы даете согласие на обработку и хранение персональных данных в соответствии спользовательским соглашением








                                Ваше имя (обязательно)

                                Ваш e-mail (обязательно)

                                Тема

                                Сообщение