En
Поиск

Выбор хромосомы

При выборе хромосомы использовалась интегральная оценка данных по каждой хромосоме, доступных в глобальных базах, таких как Entrez Gene, RefSeq, UniProt.

При анализе использовались следующие параметры:

  • число кодируемых генов
  • число кодируемых однонуклеотидных полиморфизмов (SNP)
  • а также число генов, упомянутых совместно с названиями заболеваний в одной публикации.

Основными параметрами при отборе хромосомы для проекта было с одной стороны наименьшее число кодирующих генов, а с другой — максимальная связь генов хромосомы с возникновением и развитием социально-значимых заболеваний. Согласно классификатору социально-значимых заболеваний, актуальных для России, были выбраны следующие заболевания: злокачественные опухолевые заболевания, атеросклероз, астма и псориаз. Таким образом, для каждой хромосомы человека была получена информация о числе кодирующих генов и числе генов, связанных с развитием этих заболеваний. Связь хромосомы с возникновением и развитием cоциально-значимых заболеваний рассчитывалась с применением двух подходов:

  1. с одной стороны, оценивалась частота появления в хромосоме кодируемых SNP, связанных с развитием заболевания
  2. а с другой стороны, для выявления такой связи использовались технологии автоматического анализа текстов.

Число кодируемых SNP, связанных с развитием заболевания, извлекалось из белковой базы UniProt. В основе другого подхода лежит оценка частоты совместного упоминания в одном реферате публикации названия гена и заболевания. Анализ проводился с использованием ресурса GeneRIF, который представляет аннотацию гена в виде соответствующих предложений из научных статей. Так, для каждой хромосомы было рассчитано число генов, название которых упоминалось совместно с названием заболевания в одном предложении. Показано, что сложно выделить четкую взаимосвязь между хромосомой и каким-либо исследуемым заболеванием. Тем не менее, наиболее соответствует сформулированным критериям согласно нашей оценке хромосома-18.

Все хромосомы практически одинаковы с точки зрения
ассоциативной связи с социально-значимыми заболеваниями (а)
и по количеству идентифицированных белков (б).