Интеллект определяет скорость обучения новому мастерству

Интеллект как набор способностей, создающий умения и навыки

Мы хотим специально организованным предобучением примерно бакалаврского уровня усиливать человеческий интеллект, повышая степень его широкой универсальности/генерализации/flexibility, хотя это на ступеньку меньше, чем уже сверхчеловеческая экстремальная универсальность.

При этом мы не будем забывать о ходе на универсальность через симбиоз человека с компьютерами, то есть ходе на киборгизацию, включение экзокортекса. Скажем, человек обладает биологически плохой памятью и в силу этого сниженным интеллектом — но ведение дневника поможет помнить много и неограниченно долго. Библиотека с полнотекстовой поисковой системой ещё лучше решает проблему с памятью. Человек медленно умножает десятизначные числа — калькулятор ему в этом поможет, а программируемый калькулятор и подавно. Человек с книгой и калькулятором сможет научиться решать задачи, требующие памяти и вычислений быстрее, чем человек без книги и калькулятора. Человек с книгой и калькулятором тем самым будет умнее человека без книги и калькулятора. А человек с современным даже не компьютером, а дата-центром умнее, чем человек с книгой и калькулятором. А группа людей со множеством дата-центров вообще оказывается умнее всех одиночек с компьютерами. Вы поняли идею: мы не верим в усиление чисто человеческого интеллекта, поэтому предобучать будем сразу людей с их компьютерными экзокортексами.

Chollet даёт вот такую диаграмму, определяющую интеллект:

По этой функциональной диаграмме интеллект/интеллектуальная система создаёт умение что-то делать как отдельное мастерство/умение/прикладное_знание/«программу скилла», и уже это умение решает каждую отдельную задачу, потихоньку превращаясь в нетрудный для выполнения навык («автоматизируясь» через большое число повторений, уходя в бессознательное и освобождая ресурс внимания). Интеллект — это вычислитель со способностью выработать умение. Не можешь чему-то научиться за приемлемое время — это тебе не хватает интеллекта, какого-то входящего в состав интеллекта мыслительного мастерства!

Котёнок может быть очень умным для котёнка, но не способным научиться играть на рояле. Поэтому у котёнка мы считаем интеллект слабым по сравнению с человеком (но сильным по сравнению с рыбой). Если человек оказывается неспособным научиться играть на рояле, неспособным научиться математике, неспособным научиться операционному менеджменту, и так далее по всем видам задач — мы его не будем считать очень умным, откажем ему в интеллекте. Люди-мнемоники в цирке умеют в уме умножать десятизначные цифры, в этом они не хуже калькулятора. Или помнить бессмысленный длинный текст, не хуже книжки. Мы их не считаем особо умными, если они не демонстрируют, что они могут выучиться чему-то ещё. Калькулятор или книжку мы не ценим за их интеллекты.

Если человек постоянно демонстрирует способность освоить какую-то новую предметную область (универсальность! Сила интеллекта в его универсальности: скорости освоения самых разных новых задач!), поднимая и поднимая сложность решаемых им проблем, мы говорим, что у этого человека сильный интеллект. Если человек научился решать один класс задач, но не в состоянии выучиться чему-нибудь ещё, интеллект его будет считаться слабым (неуниверсальным! Малая скорость освоения нового, времени на новое требуется столько, что жизни не хватает!) — независимо от того, насколько сложны те немногие задачи, которым этот человек смог научиться. Этот человек может считаться уникумом, артистом цирка, рекордсменом Гиннеса — но не обладателем сильного интеллекта.

Интеллект связан с универсальностью в части классов решаемых задач и скоростью обучения их решать. Единственный способ подтвердить интеллект — это демонстрировать, что ты научаешься решать всё более и более сложные новые проблемыНапример, научиться арифметике, потом высшей математике, потом инженерным вычислениям, потом вычислениям универсальных алгоритмов, и так далее — до бесконечности усложняя и меняя виды проблем, классы задач. Если ты просто демонстрируешь решение одного класса задач, вновь и вновь решая арифметические задачи и не двигаясь дальше, то интеллект не будет задействован, он так и будет считаться слабым, «достаточным только для арифметики».Интеллект врождённый и приобретённый

Сам Chollet предлагает шкалу универсальности в решении разных классов проблем как силы интеллекта использовать для оценки систем сегодняшнего машинного/искусственного интеллекта. Эти системы должны предложить какие-то элементарные функции интеллекта, «аппаратно» реализованные разработчиками-людьми, или людьми совместно с обеспечивающими/enabling создание этого интеллекта машинными интеллектами Люди не работают голыми мозгами в разработке чего бы то ни было, они задействуют компьютеры — системы автоматизации проектирования, программы имитационного моделирования, нейронные сети как универсальные аппроксиматоры и т.д.

В своей работе по измерению силы интеллекта Chollet выделяет такие подсмотренные у человеческих младенцев элементарные функции как

  • умение выделить объект по связности в его представлении в окружающем мире,
  • отслеживать этот объект в мире при его перемещениях,
  • отслеживать влияние объектов друг на друга,
  • умение преследовать какую-то цель,
  • умение считать,
  • какие-то умения в области геометрии и топологии — типа распознать симметрию в объекте, или выделить прямую линию или прямой угол.

Эти врождённые способности как частное мыслительное мастерство (а интеллект, как мы помним, состоит из широких/трансдисциплинарных способностей!) и составляют по его мнению «аппаратную» основу человеческого интеллекта, остальному люди учатся с использованием этих врождённых способностей.

Мы согласны с Chollet, что у выросшего в цивилизованном мире человека интеллект состоит из:

  • врождённых способностей/мыслительного мастерства, которые «аппаратно» имеются в мозгу человека и определяются генетически, являются результатом биологической эволюции. Эти врождённые способности могут быть использованы как основа для дальнейшего усиления интеллекта через предобучение трансдисциплинарным рассуждениям. По большому счёту простые тесты типа IQ связаны именно с врождёнными способностями. Эти способности определяются генетически, и не так много можно сделать, чтобы их усилить обучением, хотя мозг пластичен и в какой-то мере может менять свою структуру для упрощения решения каких-то часто встречающихся задач. В любом случае, речь идёт об интеллекте, именно поэтому про детей с большим IQговорят «талантливый в одном будет талантлив и в другом», это прямо совпадает с определением сильного интеллекта: «универсальный талант», а не «талант к одному классу задач». Это и есть тот самый «фактор G», фактор самых общих способностей к обучению, доступных человеку.
  • Выученных/приобретённых способностей/мыслительного мастерства, получаемых предобучением каким-то трансдисциплинам. Приобретённое мыслительное мастерство отличает людей с хорошим образованием от людей с плохим образованием: они оказываются «более талантливыми» (потому как правильно образованы, а не потому образованы, что оказались более талантливы!). Люди с хорошим образованием могут потом выполнить быструю подстройку своих знаний под новый проект, быстро освоить новое мастерство, разобраться с новым делом. А то и без подстройки: если окажется, что речь идёт об использовании каких-то универсальных умений (трансдисциплин), то и без подстройки можно справиться. А с плохим образованием люди тоже могут разобраться с новым делом, но это происходит медленно, их интеллект слабей. Почему медленно? Потому что им приходится не просто подстраивать свои знания, им приходится ещё для этого и дополнительно предобучаться, часто очень неоптимальным образом, без использования трансдисциплин как накопленного цивилизацией опыта предыдущих поколений. Представьте, что взрослый дикарь приехал из джунглей, где он только охотился и собирал растения. Сколько времени ему нужно потратить, чтобы стать инженером? Он даже в вуз пойти сразу не сможет, ведь у него не будет даже школьных знаний! Речь сразу идёт о многих годах, которые люди тратят на обучение трансдисциплинам.

Отдельно нужно обсудить: а можно ли вот так накапливать знания, передавая их от чему-то самостоятельно научившихся людей к ещё не научившимся, то есть задействуя «предобучение»? Или же каждый человек должен накапливать все знания «на опыте жизни», самостоятельно? Были проделаны эксперименты, показывающие, что передача знания от поколения к поколению вполне возможна, и эта передача идёт на естественном языке, которого оказывается вполне достаточно. Необязательно учиться всему «с полного нуля», набивать себе собственные шишки на собственных неудачах, теряя на это много времени, можно получить этот опыт предыдущих поколений из культуры, через текст[1] — и сразу начинать приобретать новый опыт, которого ещё не имели предыдущие поколения исследователей мира, предыдущие поколения инженеров, менеджеров, предпринимателей.

В принципе, проблемы можно решать хоть методом перебора разных вариантов решения, «пробами и ошибками», и это даже основной метод работы многих и многих людей, tinkering/возня как в «он возится с автомобилем», это подчёркивается в книге Нассима Талеба «Антихрупкость». Но возня/«метод проб и ошибок» срабатывает увы, за огромное время и с потреблением огромных материальных ресурсов. Ещё ведь придётся найти то, что нужно будет перебирать, заранее ведь это тоже неизвестно. Вы бы догадались, что антибиотики помогают против бактерий в те времена, когда само понятие бактерии было ещё неизвестным? Проблема поиска антибиотиков не могла быть даже поставлена! И время «возни» можно резко сократить, если возиться с какими-то уже известными из культуры предметами (например, «возиться с микропроцессором», а не возиться с очищенным кремнием в надежде, что в итоге этой возни появится какой-то компьютер, или возиться с разными сортами стали, в надежде, что когда-то из этой возни появятся огромные стальные ракеты Starship и Super Heavy. Нет, «с чем возиться» тут тоже зависит от уже накопленного человечеством знания.

Многие сегодняшние проблемы не могут быть решены сегодняшними плохо сконструированными (а эволюция ведёт к отнюдь не оптимальным «врождённым» решениям по части интеллекта[2]!) и плохо обученными (образование в мире отнюдь не идеально) людьми и машинами. Так что нужно усиливать интеллект, чтобы продолжать эволюцию (как техноэволюцию, так и биологическую) и исправлять замеченные ошибки.

Представьте, например, что мы ещё не знаем, что такое «свет», а ведь первые микроорганизмы этого не знали! Или не знаем, что такое спин[3] (который используется в спинтронике[4]), про который догадались только в 1924 году, меньше ста лет назад. Если мы мало знаем о структуре мира, то требуется огромное время интенсивных вычислений, чтобы узнать о каких-то проблемах, а затем их решить.

Если мы хотя бы частично что-то знаем о структуре мира (всегда частично, всегда мало, даже через десять тысяч лет это будет «частично» и «мало», развитие бесконечно!), это бы в десятки, тысячи, миллионы раз уменьшило количество вычислений/мышления интеллекта по выработке мастерства в решении связанного с этой особенностью структуры мира класса задач. Скажем, какую-то задачу мы можем решить человеческим мозгом за десять тысяч лет интенсивных размышлений. Это побольше, чем время существования человеческой цивилизации. Но если мы сделаем какие-то удачные догадки/гипотезы/guesses/предположения о структуре задачи и её предметной области, и они позволят снизить объем вычислений в десять тысяч раз, то проблема будет решена за год. И можно будет переходить к следующим, более сложным проблемам.

Ускорение в десять тысяч раз по сравнению с «вознёй» возможно? Бывает ли ускорение на порядки величины по сравнению с «обычной скоростью решения задач»? Да, бывает! Так, квантовые компьютеры уже в определённых классах алгоритмов несравнимо (на много порядков величины) быстрее классических компьютеров, и это квантовое превосходство/quantum supremacy[5] быстро увеличивается. Или в 2021 году было предложено ускорение на несколько порядков скорости обучения игры в видеоигры для алгоритмов обучения с подкреплением, и были достигнуты скорости обучения примерно такие же, как у человека. Буквально десяток лет назад речь шла о проблеме, которая вообще не решалась, компьютер не мог обучаться игре в видеоигры! Потом мог обучаться, но требовались огромные вычислительные мощности, и дело было хуже, чем у человека примерно в десять тысяч раз, требовался суперкомпьютер. И вот задача решена предложением нового алгоритма, использующего догадки о структуре знаний при игре[6].

Цивилизация (и особенно в ней наука, она ровно этим и занимается) даёт нам разной степени удачности общие предположения о структуре абстрактного (математические объекты) и физического мира и учит формулировать проблемы. Это приобретённый, выученный интеллект: он позволяет решать задачи в десятки тысяч (а то и более) раз быстрее, чем это могло бы быть сделано необученным структуре окружающего мира интеллектом как «аппаратной» частью мозга «дикого» человека, не получившего образования. Цивилизованный человек, мозг, интеллект (это всё вложенные части, в быту мы используем все выражения) — это обученный, образованный человек, мозг, интеллект. Цивилизованный интеллект (мозг, человек) содержит в себе не только врождённые мыслительные способности, врождённое мыслительное мастерство, но и приобретённое/выученное. Интеллект цивилизованного человека оказывается не таким уж естественным: часть его «аппаратна», но часть «программна», прошита цивилизацией в мозгу — это ничем не отличается от любого другого вычислителя. Интеллект смартфона тоже есть врождённый (аппаратный, от микропроцессора конкретной марки), а есть приобретённый — от прошивки производителя, и от конкретного мастерства его прикладных программ. Другое дело, что интеллект смартфона очень слабый, ибо микропроцессор его очень ограниченной производительности, даже с учётом того, что в современных моделях смартфонов используются аппаратные ускорители для нейросетей, да ещё и алгоритмы прошивок абсолютно не универсальны в части возможности решения разных классов проблем.

Помним, что сила интеллекта в его универсальности, а для универсальности нужна скорость работы вычислителя и разнообразие его алгоритмов: есть теорема отсутствия бесплатного обеда/no free lunch theorem, в которой говорится, что один алгоритм не может быть универсально эффективным для всех классов задач, поэтому для универсальности требуется много разных алгоритмов работы вычислителя. Об этом подробней говорится в книге Педро Домингоса «Верховный алгоритм», которую мы рекомендовали для начального знакомства с подходами к конструированию машинного интеллекта как вычислителя с универсальным (master, верховным) алгоритмом.

Итого: приобретение нового мастерства идёт у человека не через чисто «природную смекалку», а через «облагороженную образованием смекалку», через получаемые из культуры путём «импорта» готового знания о структуре мира и структуре задач — и уже к этим «импортированным» знаниям предобучения добавляется «возня»/tinkering, «опыт».

Мастерство/умение и навык/скилл/skill — это вычислители для рассуждений по какой-то прикладной дисциплине или трансдисциплине, интеллект — это набор таких вычислителей по разным видам мастерства, поддерживающих рассуждения с объектами и по правилам/объяснениями трансдисциплин. Трансдисциплины — это и есть сведения о структуре мира, удобной для скоростного мышления. Проблемакоторая займёт очень смекалистого дикаря на полжизни, у обученного мышлению с использованием трансдисциплин человека может занять несколько часов, или даже несколько секунд (особенно, если такой человек будет использовать экзокортекс).

Трансдисциплин множество самых разных, они выстроены в стек («стопку»), поскольку внутри рассуждений о каких-то одних типах объектов одних трансдисциплин будут использованы рассуждения о других типах объектов других трансдисциплин. Трансдисциплины так и определяются, как использующиеся для рассуждений о самых разных предметных областях, в том числе предметных областях друг друга! Например, в трансдисциплинах, представленных в виде интеллект-стека (приведём его в обратном порядке, снизу-вверх, чтобы было понятней, как одни трансдисциплины пользуются в своих объяснениях уже введёнными другими трансдисциплинами объектами):

  • Понятизация учит выделять фигуры из фона и делать их предметами рассмотрения
  • собранность учит удерживать во внимании «объекты», которые уже обсуждены в понятизации.
  • семантика учит отделять физические объекты от математических/абстрактных/ментальных/идеальных, тем самым разделяя объекты и их более и менее формальные описания. Но эти объекты уже могут быть удержаны во внимании.
  • теория информации учит, тому, как именно объекты из ментального мира представляются в физическом мире. Но семантика уже рассказала про разницу математических и физических объектов.
  • Теория понятий учит машинке типов: что все объекты в каком-то смысле подобны друг другу, и это описывается типами. Об объектах мы можем судить по их отношениям друг с другом. Примеры часто встречающихся типов отношений — это классификация, специализация, композиция. Теория информации при этом уже сказала, как все эти описания представлены в физическом мире на носителях информации.
  • Онтология учит отвечать на вопрос, каким способом мы описываем/моделируем мир: как мы определяем важное и неважное (моделирование), как мы используем модели для ответа на вопросы (интерпретации). Мы разбираемся с мета-моделированием (описания как абстракции получаются не произвольно, но абстрагирование управляется абстракцией более высокого уровня), разбираемся с тем, что вещи/системы на разных системных уровнях (то есть уровнях по отношению часть-целое) описываются по-разному, ибо при взаимодействии частей получаются новые свойства (эмерджентность). Модели задействуют понятия (используем теорию понятий). А ещё модели используются для проведения по ним рассуждений, т.е. используются для предсказаний, и мы уже готовы заняться рассуждениями и объяснениями.
  • Логика говорит, какие есть способы рассуждений над моделями: логический вывод, функциональная оценка, вычисления математических функций, интуитивные оценки в человеческом мозге, прикидки, предсказания, и т.д. Онтология для этого уже рассказала про то, как мы нарезали мир на объекты, описав эту нарезку какими-то моделями, так что рассуждения работают с моделями.
  • Объяснения как практика говорит о том, что рассуждения по моделям нужны для оценки причин и следствий в физическом мире, и совершенно недостаточно рассуждений только про математический мир. В этот момент из онтологии уже известно про разнообразие моделей, а из логики о разнообразии правил рассуждений.
  • Алгоритмика — это естественная наука, которая обсуждает способы проведения рассуждений по доказательству соответствия поведения математических/идеальных/ментальных объектов поведению физических объектов. Математик, физик, компьютер — это универсальные вычислители, то есть физические объекты, поведение которых как-то отражает поведение физических объектов, но это соответствие ещё нужно объяснить (что такое объяснение к этому моменту уже понятно), и доказать (вот что такое «доказать» и определяется алгоритмикой, а не физикой или математикой). Алгоритмика тем самым и про живых людей с их рассуждениями/вычислениями, и про классические компьютеры с их рассуждениями, и про квантовые компьютеры с их рассуждениями/вычислениями– всё это просто разные типы физики вычислителей.
  • Исследования как практика (практика научной теории познания/эпистемологии) говорит о том, каким образом мы получаем объяснения. Мы делаем догадки о хорошей объяснительной (причинной) модели/теории, а затем критикуем эту догадку на предмет непротиворечивых результатов рассуждений по этой модели и на предмет лучшего соответствия предсказаний этой модели с результатами эксперимента. Тут уже можно использовать понимание моделей как объяснений, рассуждений, доказательств, а также алгоритмики с её пониманием способов, которыми мы можем вести рассуждения, объяснения, доказательства.
  • Эстетика даёт критерии красоты (в исследованиях принято говорить об элегантности) в результатах мышления и прикладного труда. Эстетика рассказывает, какой отклик вызывает наше поведение не столько в окружающем мире, сколько в самих агентах (и не факт, что современная эстетика обсуждает, например, эмоциональное воздействие каких-то продуктов труда и описаний только на агентов-людей. Нет, современная эстетика рассматривает и агентов с искусственным интеллектом, и искусственную жизнь).
  • Этика говорит нам о том, чего нужно добиваться в жизни: какие цели приемлемо ставить агенту и какими средствами добиваться реализации этих целей. Должны ли люди умирать, или лучше бы их сделать бессмертными? Для этого мы уже владеем пониманием, что такое объяснения и как устроены исследования — можем теперь разбираться, что делать с результатами всех этих исследований.
  • Риторика говорит о том, как убедить какого-то человека совершить какие-то действия. Начинаем с того, что вы должны иметь какую-то модель ситуации (полученную вами в ходе исследований) и вы имеете агента, которому вы объясняете вашу модель ситуации и пытаетесь его уговорить использовать эту модель для достижения каких-то ваших целей. Но этика вам уже известна, вы не подбиваете людей на что-то плохое.
  • Методология рассказывает о труде/человеческой деятельности, в которой люди организовываются в команду, занимают в ней какие-то роли, выполняют работы по каким-то практикам и тем самым добиваются своих целей. Риторика позволяет понять, как они договариваются.
  • Экономика объясняет, что для достижения своих целей люди используют ограниченные ресурсы, которыми обмениваются, если они им нужны. Но достижение целей не гарантировано. Предприниматели пытаются предвидеть будущее и организуют предприятие, которое для достижения целей использует разнообразные ресурсы — и имеют прибыль в случае успеха предприятия и убыток в случае неуспеха. Предприятие мы рассматриваем как агента, если люди в нём договорились. А если люди и предприятия как агенты ещё не договорились о достижении какой-то цели, то это другой системный уровень, уровень общества, и поэтому для него нужны другие модели/описания/объяснения — мы уже разобрались в онтологии с системными уровнями и необходимостью разных описаний для разных системных уровней, так что пониманием системных уровней для отдельных органов агентов (у этих отдельных органов ещё нет агентности), для агентов и их предприятий (у них есть агентность) и обществ агентов (у них тоже нет агентности) проблем не будет.
  • Системное мышление рассказывает, что одни системы (целевые в их системном окружении) создаются другими системами-предприятиями, проходя множество состояний, смену которых дают практики жизненного цикла. Онтология рассказывает об основных описаниях, которые нужны для объяснений при создании систем. Уже в 21 веке было признано, что в число необходимых системных описаний входит не только функциональное, конструктивное и компоновочное/пространственное описание в их развёртках по времени, но и ресурсное описание — экономика позволяет как-то обсуждать эти ресурсы, а также предпринимательскую целесообразность выполнения проекта.
  • Труд описывается набором трансдисциплин важнейших трудовых практик — это трансдисциплины инженерии как изменения физического мира (включая кроме инженерии в традиционном строительном и машиностроительном варианте и варианты программной инженерии, образования, медицины и прочих трудовых практик по изменению мира), менеджмента (труд по проектированию, созданию и эксплуатации предприятий), предпринимательства (труд по замысливанию предприятий и их стратегированию/нацеливанию на какой-то рынок). Для рассуждений о трудовых практиках задействуются все предыдущие уровни интеллект-стека (особенно если учесть, что в качестве агентов действуют люди, люди и компьютеры, и даже уже иногда сами компьютеры).

И только после срабатывания всего этого интеллект-стека прикладная трудовая инженерная дисциплина Jobs-to-be-done из практики инженерии требований говорит, как именно прописывать требования к системе.

Каждая мыслительная практика, основанная на фундаментальной дисциплине/трансдисциплине помогает разобраться со следующей мыслительной практикой, а в конце их цепочки — с прикладной практикой, основанной на прикладной дисциплине, которая поддержана какими-то инструментами моделирования (моделерами, специальным софтом для удобного описания ситуаций). Можно было бы сказать не только «системное мышление», но и «онтологическое системное мышление», ибо системное мышление основано на трансдисциплине онтологики. Системная инженерия — это инженерия, описания практик которой основаны на системном мышлении. Можно было бы добавить и в это название онтологику: «онтологическая системная инженерия», так иногда и говорят — ontology based systems engineering[7]. Но обычно ограничиваются только одной практикой из интеллект-стека, когда хотят подчеркнуть, что речь идёт о как-то вписанной в интеллект-стек практике или трансдисциплине, а не просто «отдельно взятой изолированной ото всего практике».

Источник: книга А. Левенчука «Образование для образованных 2021».