При выборе хромосомы использовалась интегральная оценка данных по каждой хромосоме, доступных в глобальных базах, таких как Entrez Gene, RefSeq, UniProt.
При анализе использовались следующие параметры:
Основными параметрами при отборе хромосомы для проекта было с одной стороны наименьшее число кодирующих генов, а с другой — максимальная связь генов хромосомы с возникновением и развитием социально-значимых заболеваний. Согласно классификатору социально-значимых заболеваний, актуальных для России, были выбраны следующие заболевания: злокачественные опухолевые заболевания, атеросклероз, астма и псориаз. Таким образом, для каждой хромосомы человека была получена информация о числе кодирующих генов и числе генов, связанных с развитием этих заболеваний. Связь хромосомы с возникновением и развитием cоциально-значимых заболеваний рассчитывалась с применением двух подходов:
Число кодируемых SNP, связанных с развитием заболевания, извлекалось из белковой базы UniProt. В основе другого подхода лежит оценка частоты совместного упоминания в одном реферате публикации названия гена и заболевания. Анализ проводился с использованием ресурса GeneRIF, который представляет аннотацию гена в виде соответствующих предложений из научных статей. Так, для каждой хромосомы было рассчитано число генов, название которых упоминалось совместно с названием заболевания в одном предложении. Показано, что сложно выделить четкую взаимосвязь между хромосомой и каким-либо исследуемым заболеванием. Тем не менее, наиболее соответствует сформулированным критериям согласно нашей оценке хромосома-18.
