Новости

Банки ДНК оказались наиболее быстро растущим сегментом сети

Банки ДНК виявилися найбільш швидко зростаючим сегментом мережі

Youtube, Twitter и другие быстро растущие сегменты Интернета оказались карликами по сравнению с банками геномных данных, чьи астрономические темпы роста могут создать множество проблем с хранением данных в ближайшие 10-15 лет.

Наиболее динамичным и быстро растущим сегментом глобальной сети в ближайшие 10-15 лет будут не видеохостинги или в социальные сети, а банки геномных данных и связанные с ними порталы. Для омоложения используйте биоревитализация .

«По мере дальнейшего улучшения технологий анализа ДНК и уменьшение цены этой процедуры, мы ожидаем настоящий взрыв в распространении технологий секвенирования в повседневной жизни и вызванный этим информационный «потоп». Единственная возможность пережить его – улучшить компьютерную инфраструктуру, что отвечает за обработку геномных данных», — заявил Джин Робинсон (Gene Robinson) из университета штата Иллинойс в Урбане (США).

Робинсон, генетик по специальности, а также математиков и программистов решили оценить масштабы этого взрыва, сравнив как развивались самых быстрорастущих сегментов глобальной сети в последние годы – социальные сети, видеохостинги и распределенные системы обработки научной информации.

В качестве двух первых выступали всем знакомые порталы – сервис микроблогов Twitter и видеохостинг Youtube, а в роли третьего выступал ряд проектов по астрономии, физике элементарных частиц и молекулярной биологии.

Вопреки ожиданиям ученых, больше всего за последние годы выросли объемы обрабатываемой, передаваемой и хранимой информации в соцсетях и видеохостингах, а в геномных банках данных.

Для сравнения, первые производят примерно по 10-100 петабайт (миллионов гигабайт) «оригинального контента» ежегодно, что может показаться не очень большой цифрой. Геномные базы данных пополняются аналогичным образом, однако скорость их роста в разы больше – каждые семь-восемь месяцев объем новых генетических данных удваивается.

Благодаря этому, буквально за десять лет интернет-банки геномной информации будут «толстеть» на несколько эксабайт (тысяч петабайт) на год, что создаст множество проблем с хранением и обработкой подобной массы данных. Большая часть из них будет усилена тем, что биологи, в отличие от физиков и астрономов, еще не выработали единых стандартов обработки, сжатия и архивирования геномной информации.

Как объясняют авторы статьи, генетики не смогли создать алгоритм, который позволил бы им «выбрасывать» общие и незначительные фрагменты человеческой ДНК. Благодаря этому хранение геномов даже членов «золотого миллиарда» потребует накопителей емкостью в несколько эксабайт, что является большой проблемой сегодня и будет тяжело и через 10 лет.

«Очень долго люди использовали прилагательное «астрономический» для описания вещей, которые имеют поистине гигантский масштаб, объем или размер. Раскрыв невероятную скорость прироста геномных данных, я и коллеги теперь предлагаем называть подобные вещи не «астрономическими», а «геномными», — заключает Майкл Шатц (Michael Schatz) из Лаборатории Колд-Спринг-Харбор (США).

Источник

You may also like...