В нашия геном се крият улики към неизвестните ни предци


Може ли дълбокото обучение да помогне на палеонтолозите и генетиците да ловуват за призраци?

Когато преди 70 000 години съвременните хора първо мигрираха от Африка, най-малко два сродни вида, вече изчезнали, вече ги очакваха на евразийската земна маса. Това са неандерталците и денисовите, архаични хора, които се сливат с тези ранни модернисти, оставяйки части от ДНК зад себе си днес в геномите на хора от неафрикански произход.

Списание Quanta


авторска снимка

относно

Оригиналната история е препечатана с разрешение от Quanta Magazine, редакционно независима публикация на Фондация Симонс, чиято мисия е да подобри общественото разбиране на науката, като обхваща научноизследователските разработки и тенденциите в математиката и физическите и биологичните науки.

Но имаше все по-големи намеци за още по-сложна и колоритна история: Екип от изследователи съобщиха за това природа миналото лято, например, че костен фрагмент, намерен в сибирска пещера, принадлежал на дъщерята на неандерталска майка и на баща на Денисован. Откритието е първото доказателство за изкопаеми човешки хибриди от първо поколение.

За съжаление, рядко се срещат такива вкаменелости. (Нашите познания за Denisovans, например, се основават на ДНК, извлечена от кост само на пръст.) Много други предшественици могат лесно да се появят, включително такива, които включват хибридни групи от по-ранни кръстове – но те могат да бъдат практически невидими, когато става въпрос за физическо доказателство. Указанията за тяхното появяване могат да оцелеят само в ДНК на някои хора и дори тогава те могат да бъдат по-фини от признаците на неандерталски и денисови ген. Статистическите модели са помогнали на учените да направят извод за съществуването на няколко от тези популации без данни за вкаменелостите: Например, според проучване, публикувано в края на 2013 г., моделите на генетични вариации в древните и съвременни хора сочат към непозната човешка популация, която се е кръстила с Денисова (или техните предци). Но експертите смятат, че тези методи неизбежно пренебрегват много.

Кой друг е допринесъл за днешните геноми? Как изглеждат тези така наречени популации на призрак, къде живеят и колко често те взаимодействат и се чифтосват с други човешки видове?

В статия, публикувана миналия месец през 2008 г. T Nature Communications, изследователите показаха потенциала за дълбоки техники на обучение, които да помогнат да се запълнят някои от липсващите парчета, парчета, за които експертите дори не са знаели. Те използвали дълбоко учене, за да пресекат доказателства за друго население от призраци: неизвестен човешки предшественик в Евразия, вероятно неандерталско-денисовиден хибрид или роднина на линията Денисован.

Работата сочи към бъдещата полезност на изкуствения интелект в палеонтологията, не само за идентифициране на непредвидени призраци, но и за разкриване на много избледнелите отпечатъци на еволюционните процеси, които са оформили кои сме ние.

Търсене на фини подписи

Настоящите статистически методи включват изследване на четири генома в момент за споделени черти. Това е тест за сходство, но не непременно с истинско потекло, защото има много различни начини за тълкуване на малките количества генетична смес, които той разкрива. Например, такива анализи могат да подсказват, че съвременният европейски гражданин споделя някои черти с генома на неандерталците, но не и на съвременния африкански. Но това не означава непременно, че тези гени идват от кръстосване между неандерталците и предците на европейците. Последните, например, биха могли вместо това да се отглеждат с различно население, което е тясно свързано с неандерталците, но не и с самите неандерталци.

Ние просто не знаем, защото при липсата на физически доказателства, които да показват кога, къде и как биха могли да живеят тези древни хипотетични източници на генетични вариации, е трудно да се каже коя от многото възможни изводи е най-вероятна. Техниката „е мощна поради своята простота, но оставя много на масата по отношение на разбирането на еволюцията”, казва Джон Хоукс, палеоантрополог от Университета на Уисконсин-Мадисън.

Новият метод за дълбоко обучение е опит да се направи по-добре, като се търсят обяснения за нивата на генния поток, които са твърде малки за обичайните статистически подходи, и чрез предлагане на далеч по-обширна и сложна гама от модели за това. Чрез обучението, невронната мрежа може да се научи да класифицира различни модели в геномните данни въз основа на това, което демографските истории най-вероятно са ги породили, без да им се казва как да правят тези връзки.

Това използване на дълбоко учене може да разкрие призраци, които дори не сме подозирали. От една страна, няма причина да смятаме, че неандерталците, денисовите и съвременните хора са само трите популации на снимката. Според Хоукс можеше да има десетки.

Джейсън Люис, антрополог от университета Стони Брук в Ню Йорк, споделя това мнение. "Нашето въображение е ограничено от фокусирането ни върху живите хора или върху вкаменелостите, които сме намерили от Европа, Африка и Западна Азия", каза той. „Това, което техниката за дълбоко учене може да направи по един странен начин, е преориентирането на възможностите. Подходът вече не е ограничен от нашето въображение.

Реалната стойност на симулираните истории

Дълбокото обучение може да изглежда като малко вероятно решение на проблема с палеонтолозите, защото тези методи обикновено изискват огромни количества данни за обучение. Вземете едно от най-често срещаните приложения като класификатор на изображението. Когато експерти обучават модел, да кажем, да идентифицират изображения на котки, те имат хиляди снимки, с които могат да го обучат, и самите те знаят дали работи, защото знаят как трябва да изглежда котката.

Но недостигът на подходящи антропологични и палеонтологични данни накара изследователите, които искаха да използват дълбоко обучение, за да се умножат, като създават свои собствени данни. "Бяхме свирели да играем мръсни", казва Оскар Лао, изследовател в Националния център за геномни анализи в Барселона и един от авторите на изследването. "Можем да използваме безкрайно количество данни, за да обучим двигателя за дълбоко обучение, защото използвахме симулации."

Изследователите генерираха десетки хиляди симулирани еволюционни истории, основаващи се на различни комбинации от демографски детайли: броя на човешките популации на предците, техните размери, когато те се отклониха един от друг, степента на смесване и т.н. От тези симулирани истории учените генерираха огромен брой симулирани геноми за съвременните хора. Те обучиха своя алгоритъм за дълбоко обучение на тези геноми, така че той научи кои видове еволюционни модели са най-вероятно да произвеждат дадени генетични модели.

След това екипът поставя изкуствения интелект на свобода, за да изведе историите, които най-добре отговарят на действителните геномни данни. В крайна сметка системата стигна до заключението, че досега неидентифицираната човешка група е допринесла за потеклото на хора от азиатски произход. От засегнатите генетични модели, тези хора вероятно са били или отделна популация, възникнала от кръстосването на Денизовани и Неандерталци преди около 300 000 години, или група, която произхожда от потомството на Денизован малко след това.

Това не е първият път, в който дълбокото обучение е било използвано по този начин. Няколко лаборатории в тази област прилагат подобни методи за справяне с други теми от еволюционното изследване. Една изследователска група, ръководена от Андрю Керн от Университета в Орегон, е използвала симулационен подход и техники за машинно обучение, за да разграничи различните модели на еволюцията на видовете, включително хората. Те открили, че повечето адаптации, благоприятствани от еволюцията, не разчитат на появата на полезни нови мутации в популациите, а на разширяването на генетични варианти, които вече съществуват.

Прилагането на дълбоко обучение "към тези нови въпроси", казва Керн, "дава вълнуващи резултати."

Hype Versus Hope за новия инструмент

Разбира се, има големи предупреждения. От една страна, ако действителната човешка еволюционна история не прилича на симулираните модели, на които се обучават тези дълбоки методи на обучение, тогава техниките ще дадат неверни резултати. Това е проблем, с който Керн и други се опитват да се справят, но предстои още много работа, за да се осигурят по-големи гаранции за точност.

„Мисля, че AI е преувеличен в приложенията към геномиката“, казва Джошуа Аки, еколог и еволюционен биолог в Принстънския университет. „Дълбокото обучение е фантастичен нов инструмент, но това е просто друг метод. Това няма да реши всички загадки и усложнения, за които искаме да научим в човешката еволюция. "

Някои експерти са още по-скептични. „Моята преценка е, че плътността и качеството на данните не са идеални за много други неща, освен за интелигентни и интелигентни анализи”, пише в писмото Дейвид Пилбим, палеонтолог от Харвардския университет и музея Пийбоди.

Все пак, по мнението на други палеонтолози и генетици, това е добра стъпка напред, нещо, което може да се използва за прогнози за възможни бъдещи открития на изкопаеми и очаквани генетични вариации, които трябваше да съществуват сред хората от преди хиляди години. "Мисля, че дълбокото обучение наистина ще даде тласък на генетиката на населението", каза Лао.

Същото може да се отнася и за други области, в които имаме достъп до данни, но не и за процеса, който го е създал. Почти по същото време, когато Керн и други генетици и еволюционни биолози развиват симулационни техники за ИИ, за да отговорят на своите въпроси, физиците правят това, за да разберат как да пресяват тоновете данни, получени от Големия адронен ускорител и други ускорители на частици. , Геоложките изследвания и методите за прогнозиране на земетресения също са започнали да се възползват от този вид дълбоки подходи за обучение.

„Където това води, наистина не знам. Ще трябва да видим – каза Ник Патерсън, изчислителен биолог в Института за технологии на Масачузетс и Харвардския университет. – Но винаги е добре да се видят нови методи. Ще използваме всичко, което можем, ако изглежда, че е добре да отговорим на въпросите, на които искаме да отговорим. "

Оригиналната история е препечатана с разрешение от Quanta Magazine, редакционно независима публикация на Фондация Симонс, чиято мисия е да подобри общественото разбиране на науката, като обхваща научноизследователските разработки и тенденциите в математиката и физическите и биологичните науки.


Още страхотни истории