Herbert SIMON, chercheur infatigable et citoyen attentif, a beaucoup publié, en général sous la forme d'articles dans des revues scientifiques très diverses. En soixante ans, plus de six cents articles originaux, (auxquels il faudrait ajouter d'innombrables traductions dans presque toutes les grandes langues qu'il supervisait souvent, du Français au chinois). S'il en a rassemblé un tiers environ dans des recueils accessibles dans les bonnes bibliothèques (la série des "Models of ; of Man , of Bounded Rationality, of Thougth, of Discovery, , les autres ne sont pas toujours d'accès aisé pour qui n'est pas proche du Fond déposé au Mémorial H.Simon de Carnegie-Mellon University à Pittsburgh. (Penn. USA). Ceci est particulièrement le cas pour les quelques rares articles traduits en Français. Et publiés dans des revues qui ont disparu ou dont les fonds anciens sont dispersés.
Ceci nous a incité à constituer sur le site MCX - APC ce Dossier des INTROUVABLES en langue française de H.A. SIMON. Au fil des découvertes ou des redécouvertes, nous nous efforcerons de rendre aisément accessible, dans leur version en langue française originale, ces "articles dits introuvables ".
Nous préciserons chaque fois les références et dates précises de ces traductions et publication, de façon que l'on puisse les situer dans les contextes dans lesquels ils furent initialement diffusés.
Nous remercions les correspondants qui disposent du texte
d'un de ces Introuvables, nous le communiquerons : Nous nous efforcerons
de l'insérer dans ce dossier modeste et ouvert. J.L. Le Moigne.
Août 2001:
H.A. SIMON "L'Unité des arts et des Sciences : la psychologie de la pensée et de la découverte
Traduction de la "Bicentenial Address présentée
à l'American Academy of Arts and Sciences en mai 1981 (Focus on the
social sciences)" Traduit en français par J.L. le Moigne et publié
initialement dans la revue "AFCET INTERFACES", (n° 15, janvier 1984
, p. 1 -16.), puis dans "la Gazette des Sciences Mathématiques du
Québec" (Vol. IX, n° 3, Avril 1985.)
Septembre 2001:
H.A. SIMON "Les nouvelles sciences : Comprendre les scie,nces de l'artificiel
Texte de la Conférence présentée par H.
A. Simon aux Débats de l'AFCET, , le 6 février à Paris
, édité ultérieurement dans la série "Les
débats de l'AFCET , N° 2 "
.à paraître prochainement
.
A Suivre
Les deux cultures
Dans Les deux cultures et la révolution scientifique (1),
C.P. Snow avait attiré notre attention sur l'incompréhension
mutuelle des artistes et des scientifiques, et sur quelques-unes des
conséquences que doit subir notre société à la
suite de cette attitude. Il présentait cette situation comme
asymétrique: un très grand nombre de scientifiques ont accès
aux arts et aux humanités, alors que seul un petit nombre de
littéraires (2) et d'artistes sont en mesure d'accéder à
la science et à la technologie.
Quelques littéraires (par exemple le critique anglais Leavis),
interprétant l'essai de Snow comme une attaque contre les humanités,
réagirent de façon défensive. Mais l'intention de Snow
n'était pas d'attaquer; il essayait de décrire, et non pas
de blâmer; l'asymétrie qu'il signalait, aussi déplorable
soit-elle, est une donnée de fait. Bien des scientifiques et des
ingénieurs s'épanouissent joyeusement au contact de la musique,
de la littérature et de la peinture; certains d'entre eux sont même
des compositeurs, des instrumentistes, des écrivains ou des peintres...
du dimanche; alors que le nombre des artistes ou des littéraires qui
consomment ou produisent des connaissances scientifiques ou technologiques
est bien plus faible. (Chacun de nous, bien sùr, consomme les produits
de la technologie, mais il s'agit d'une autre question: ce type de consommation
n'entraîne pas la compréhension des processus qui soutiennent
le fonctionnement des systèmes technologiques.)
Il y a au moins deux bonnes raisons pour qu'une large part de la population,
même éduquée par ailleurs, soit quasi-illettrée
en matière scientifique. La première vient de ce que les questions
relevant des sciences de la nature ont été traditionnellement
exclues du champ des connaissances exigées des personnes à
qui l'on conférait une éducation libérale(3). On
présume que ces personnes sont capables de se délecter au contact
de livres, de peintures et de pièces musicales, capables aussi d'engager
une conversation intelligente à leur sujet; elles doivent sans doute
posséder quelques connaissances en histoire et peut-être en
politique et en culture sociale contemporaine. Mais ces dernières
même ne devraient pas être transmises par une représentation
formalisée des sciences sociales
La seconde raison de cette asymétrie tient au fait qu'une grande partie
de la population se déclare incapable de parvenir à maîtriser
les mathématiques, ou les connaissances scientifiques dont la
compréhension fait appel aux mathématiques, sans éprouver
des souffrances inconcevables. Une personne intelligente, dans notre
société, ne sera nullement embarrassée de devoir admettre
tant son ignorance en mathématiques que sa totale incapacité
à acquérir quelques compétences dans cette discipline.
C'est une licence que s'arrogent bien des personnes cultivées.
Culture mathématique et culture politique
Cette situation serait acceptable si les sciences et les mathématiques
ne concernaient pas d'immenses domaines de notre société.
Malheureusement, il n'en va pas ainsi. Chaque problème important,
ou presque, qu'affronte aujourd'hui la société est
complètement imprégné de considérations scientifiques
et technologiques. Et si nous tenons les sciences sociales et les sciences
du comportement pour des sciences à part entière - ce que nous
devons faire - l'exceptionnelle importance de solides connaissances scientifiques
pour assurer des politiques judicieuses, est encore plus évidente.
Comme la science et la technologie sont largement reconnues comme les bases
d'un vaste pouvoir dans une société industrielle comme la
nôtre, bien des personnes cultivées et intelligentes se sentent
exclues par-là même des cercles du pouvoir: elles pensent que
les décisions cruciales concernant la société doivent
être faites par l'élite technologique qui commande le complexe
militaro-industriel. Ou si elles s'efforcent de s'attaquer aux questions
politiques saturées de technologie, elles craignent de devenir les
victimes de démagogues scientifiques - de tous les bords - dont elles
ne pourront pas évaluer ni les arguments ni les démonstrations.
Cette perception d'une absence de pouvoir - qu'elle soit ou non conforme
à la réalité - constitue un danger patent pour le
développement à long terme des institutions démocratiques.
La confiance dans la démocratie repose sur l'hypothèse que
des individus raisonnables et d'intelligence normale sont capables de façon
objective d'effectuer des choix politiques et de parvenir à des consensus.
Le fait que la plupart des décisions politiques impliquent quelques
conflits d'intérêt, constitue un argument contre la solution
qui consiste à confier les décisions aux experts. Le système
démocratique doit permettre de réviser et d'évaluer
les jugements des experts. Si l'on croyait que de telles révisions
sont impossibles faute de connaissances techniques suffisantes chez les
superviseurs un des principaux arguments sur lesquels s'appuie la pratique
de la démocratie disparaîtrait. Aussi est-il exceptionnellement
important pour notre société, de trouver des solutions au
problème des deux cultures.
La thèse des deux hémisphères: intuitif contre analytique
?
Le gouffre qui sépare les sciences et les arts est en outre élargi
et approfondi par des spéculations récentes issues de recherches
en psychologie et en neurologie, relatives à la spécialisation
des deux hémisphères cérébraux. Il est bien connu
en effet que les deux hémisphères n'ont pas des fonctions
identiques; la plupart des mémoires requises par l'usage du langage,
par exemple, sont gérées par l'hémisphère gauche
(pour les droitiers), alors que certains processus associés à
la formation des images visuelles sont développés dans
l'hémisphère droit.
Ces différences, encore bien peu comprises, ont été
délayées par quelquesuns sous une forme romanesque, celle
des deux modes de la pensée humaine: la pensée "holistique"
ou "intuitive" étant affectée à l'hémisphère
droit, et la pensée analytique" ou "logique", à
l'hémisphère gauche. Dans cette conception romanesque, c'est
l'hémisphère droit qui préside à la création
artistique (et peutêtre à toute activité
créative"), alors que le gauche est responsable de l'activité
scientifique et technologique à l'exception peut-être
de leur part proprement créative. Si cette conception était
acceptée, alors les deux cultures vivraient séparées,
chacune en son ghetto, dans le cerveau de chaque homme; même avec l'aide
du corps calleux, ce pont neural qui connecte les deux
hémisphères les chances d'arriver à une bonne
compréhension entre elles seraient bien minces!
J'appelle romanesque cette conception opposant les pensées analytiques
et holistiques, parce qu'aucune preuve expérimentale n'appuie l'idée
qu'une tâche cognitive complexe quelconque puisse être assurée
par un seul hémisphère spécialisé; en particulier,
l'hémisphère droit peut parfois être sévèrement
endommagé, même chez des adultes, sans entraîner de
conséquences sérieuses sur le fonctionnement de la pensée.
En outre, d'un point de vue histologique, les hémisphères sont
très similaires, et, dans le cas de dommages dans un jeune cerveau,
l'un des hémisphères peut assurer presque sans affaiblissement,
les fonctions de l'autre! Les développement~ modernes de la psychologie
cognitive, en particulier, l'essor de l'école du "traitement de
l'information" (4), nous proposent une nouvelle base pour examiner le
problème "des deux cultures".
La psychologie du traitement de l'information nous donne une représentation
empirique théoriquement fondée des processus de la pensée
humaine, y compris la pensée créatrice. Ce modèle
suggère fortement l'hypothèse d'un processus de base commun
à toutes les créativités dans les divers domaines où
elles s'exercent; ce qui jette quelque doute sur l'hypothèse selon
laquelle la spécialisation des hémisphères serait liée
à deux modes distincts de pensée. La psychologie du traitement
de l'information autorise aussi à poser la question (à ce jour
sans réponse) de l'origine de "l'analphabétisme mathématique"
chez des sujets par ailleurs intelligents: atelle quelque base
profonde dans les différences innées entre individus, ou
estelle d'abord une question de motivations?
L'objectif principal de cet article est de proposer un modèle des
processus de la pensée humaine, de l'apprentissage et de la
découverte, modèle que dégage la recherche contemporaine
en psychologie; puis de commenter les implications de ce modèle
quant aux relations entre les arts et les sciences, et plus
généralement, quant à notre compréhension de
la condition humaine.
Le dernier quart de siècle a vu la naissance d'un important paradigme
nouveau (autrement dit un modèle), conceptualisant les processus de
manipulation de symboles, y compris ceux qui sont impliqués dans la
pensée humaine, mais sans par ailleurs s'y limiter. Plusieurs labels
différents ont été appliqués à ce nouveau
paradigme, qui a émergé dans différentes disciplines
déjà existantes; on a parlé de psychologie du traitement
de l'information, d'intelligence artificielle, de computation (5) non
numérique, de traitement de l'information complexe, et ainsi de suite.
Plus récemment, comme son caractère interdisciplinaire et ses
implications devenaient plus évidents, les scientifiques et les
professionnels utilisant ce paradigme dans les domaines de la psychologie,
de la linguistique, de la computique(5), de la philosophie et de l'anthropologie,
ont cherché à améliorer leurs communications mutuelles
sous la bannière commune d'une "science de la cognition" (6). Et comme
cela est inévitable lors de tels développements, on a
éprouvé le besoin de fonder une Cognitive Science Society
(7) qui publie une revue trimestrielle.
Pour les scientifiques qui ont rejoint la bannière de la science de
la cognition, ce nouveau paradigme propose une solution claire à
quelques-uns des problèmes de conceptualisation et de représentation
qu'ils rencontraient. Certaines de ces recrues voient même dans les
solutions de problèmes qu'ils n'avaient pas perçus ou
formulés auparavant, une nouvelle façon de regarder les choses.
Est-ce par hasard ou est-ce par une conséquence du fait que nous avons
appris a nous tourner vers des conceptualisations plus productives que nous
avons vu se transformer les questions autant que les réponses?
L'hypothèse du système de symbole physique
Au cur du nouveau paradigme du traitement de l'information repose une
hypothèse qu'Allen Newell et moi avons appelée l'hypothèse
du système de symbole physique (8). L'hypothèse peut être
exprimée en ces termes:
Un système de symbole physique dispose des moyens nécessaires
et suffisants pour exercer une action générale intelligente.
Autrement dit, tout système qui manifeste une intelligence
générale sera nécessairement un système de symbole
physique, et tout système de symbole physique d'une taille suffisante
peut être organisé de manière à manifester une
intelligence générale.
Dans cette hypothèse, la formule "système de symbole physique"
nécessite une définition. Un système de symbole physique
consiste en un ensemble d'entités appelées symboles ou formes
organisées (patterns), qui peuvent être associées, par
le jeu d'une ou de plusieurs relations, en de plus grandes structures - comme
les atomes peuvent être combinés en molécules - et peuvent
être transformées par un petit ensemble de processus de base.
Ces processus peuvent créer de nouveaux symboles (par exemple, en
réponse à un stimulus externe, un processus que nous appelons
lecture transformera des symboles en une réponse externe,
l'écriture). Ils peuvent créer et modifier des relations entre
les symboles, stocker plus ou moins indéfiniment des chaînes
de symboles, ou encore comparer des symboles par identité ou par
différence. Enfin, des traitements ultérieurs peuvent
éventuellement affecter les résultats des comparaisons (ce
sont les branchements).
Ces symboles sont "physiques" en ce qu'ils possèdent un substrat physique
ou biologique; ils ont des formes organisées, réalisées
par des circuits électriques ou électroniques, par des champs
électriques et magnétiques dans des diodes au germanium ou
sur des bandes magnétiques, par des circuits neuronaux, par des
macro-molécules, et par bien d'autres voies. Ce qui rend remarquables
et de grande importance ces systèmes de symbole physique est que,
bien qu'ils doivent avoir quelque substrat physique, la nature de
ce substrat importe peu, pour autant qu'elle puisse supporter à la
fois une grande diversité de formes organisées et d'agencements
de ces formes, de même que les processus de bases
énumérés précédemment qui assurent leurs
transformations, leurs opérations et leurs modifications.
De ce fait, des systèmes de symboles fonctionnellement équivalents,
bien qu'utilisant des substrats entièrement différents peuvent
exister. Un ordinateur des années cinquante et un ordinateur contemporain
n'ont presque aucun composant physique en commun - leurs mémoires
et leurs mécanismes d'interconnections sont basés sur des principes
physiques complètement différents - et pourtant toute computation
qui peut être effectuée sur l'un peut l'être sur l'autre
(dans certaines limites de capacité et de vitesse de mémorisation).
Ils sont fonctionnellement équivalents sans posséder aucune
équivalence physique.
Bien plus, le substrat d'un système de symbole peut être biologique,
former une collection de neurones, par exemple, ou de
macromolécules. Il n'y a pas de raison de principe qui interdise
à un système biologique d'être fonctionnellement
équivalent à un système possédant un substrat
physique, ni que le premier ne puisse pas simuler le second, et vice versa.
L'hypothèse du système de symbole physique a deux importants
corollaires:
Corollaire 1: Un ordinateur, programmé de façon appropriée
peut engager une action générale intelligente;
Corollaire 2: Le cerveau humain est un système de symbole physique.
Le premier corollaire résulte de l'hypothèse initiale, puisque
l'on peut vérifier directement que tout ordinateur numérique
classique satisfait la définition d'un système de symbole physique.
Le second corollaire résulte de l'observation des capacités
d'action intelligente de l'être humain.
L'hypothèse du système de symbole physique et ses corollaires
ne doivent pas être acceptés ou refusés a priori: il
s'agit d'hypothèses empiriques susceptibles d'être
vérifiées de manière expérimentale. Si le premier
corollaire est vrai, comme l'implique l'hypothèse, il doit être
possible de programmer des ordinateurs qui manifestent une action intelligente.
Si le second corollaire est vrai, il doit être possible de démontrer
que les processus qu'emploie le cerveau humain pour accomplir une action
intelligente sont précisément du type des processus symboliques
postulés par l'hypothèse. Ce dernier quart de siècle
a vu le développement d'un vaste ensemble de recherches dont les
résultats corroborent fortement ces deux hypothèses.
Notons ici que si ces recherches augmentent notre conviction de
l'équivalence fonctionnelle du cerveau et de l'ordinateur, elles ne
nous disent pratiquement rien des modalités selon lesquelles les symboles
sont représentés physiologiquement dans le cerveau, ni sur
les conditions dans lesquelles sont assurés physiologiquement les
traitements d'information qui opèrent sur ces symboles. Nous rencontrons
une situation tout à fait comparable à celle de la chimie au
XIXe siècle, où une théorie puissante et
élaborée des réactions chimiques était
édifiée bien avant que ne le soient les théories des
structures atomiques pouvant expliquer pourquoi certains mélanges
étaient stables et d'autres pas, ou pourquoi certaines réactions
se développaient et d'autres pas. Ce type d'anticipation n'est pas
du tout inhabituel dans les sciences de la nature, comme l'illustre aujourd'hui
l'état de la théorie des particules élémentaires.
S'il n'en allait pas ainsi, tout l'édifice de la connaissance scientifique
tremblerait à chaque perturbation de la théorie des quarks.
Ainsi, la science de la cognition est pour le moment concernée surtout
par ce type de "chimie mentale", dont le substrat physiologique est
sûrement présent, mais n'a pas encore été
déchiffré.
L'intelligence artificielle
On appelle habituellement intelligence artificielle la branche de la science de la cognition qui est principalement consacrée au premier corollaire de l'hypothèse du système de symbole physique. Les produits typiques des recherches en ce domaine sont les programmes informatiques qui jouent aux échecs au niveau d'expert, voire de maître, qui diagnostiquent des maladies internes (programme INTERNIST ) ou microbiennes (programme MYCIN), qui découvrent les circuits de réactions assurant la production de composants organiques ou qui reconnaissent le langage parlé.
Les processus utilisés par un programme d'intelligence artificielle
pour accomplir sa tâche peuvent ou non ressembler à ceux qu'utilise
l'être humain pour accomplir la même tâche. Par exemple,
la plupart des programmes d'échecs existants, mais pas tous, mettent
en oeuvre des explorations considérables utilisant les capacités
de vitesse et de mémorisation des ordinateurs modernes, explorations
que les joueurs humains seraient tout à fait incapables de conduire.
Dans beaucoup de programmes d'intelligence artificielle, la force brutale
de l'ordinateur se substitue à l'astuce humaine. Mais il n'en va ainsi
que partiellement. La plupart des programmes d'intelligence artificielle
s'inspirent, pour l'intégrer, de la connaissance que nous avons des
processus humains correspondants, et en particulier de ces heuristiques qui
nous permettent d'être si remarquablement sélectifs dans nos
explorations. De ce fait, au cours des vingtcinq dernières
années, la psychologie a contribué de façon continue
aux recherches en intelligence artificielle, et réciproquement, les
recherches en ce domaine ont suggéré à la psychologie
cognitive des hypothèses intéressantes sur les processus de
la pensée humaine.
La psychologie cognitive
La branche de la science de la cognition qui se rapporte à la
compréhension de la pensée humaine et aux processus de
résolution de problèmes est habituellement appelée la
psychologie du traitement de l'information.
Les produits caractéristiques de ces recherches sont par exemple les
programmes de jeu d'échecs (tels que MATER), qui inventent
des combinaisons conduisant au mat et ne mettent en oeuvre que des explorations
relativement modestes, ou les programmes qui lisent des problèmes
dans des manuels de physique et qui les résolvent, ou les programmes
qui extrapolent des séquences organisées de chiffres ou de
lettres (telles que "ABM-CDM..."), ou les programmes qui résument
des histoires enfantines, ou les programmes qui apprennent à
résoudre des équations algébriques en analysant quelques
cas usuels etc.
On distingue ces programmes de simulation cognitive des programmes d'intelligence
artificielle pure, par le fait que les premiers sont conçus pour utiliser
les mêmes organisations de processus que ceux que met en oeuvre
l'être humain accomplissant les mêmes tâches, et parce
qu'on les compare en détail avec les données fournies par
l'étude du comportement des êtres humains engagés dans
une action de résolution de problème, afin de voir s'il y a
bien correspondance entre les deux méthodes.
Pour donner une idée de la manière dont on peut expliquer la
pensée par le traitement de l'information, considérons une
tâche mathématique simple telle que la résolution d'une
équation algébrique linéaire à une variable
4X +7 = X + 134X = X + 6
3X =6
X =2
Comment parvient-on à ce résultat? Quels sont les processus
mis en oeuvre? La solution de l'équation est une expression ayant
une forme particulière: un "X" suivi par un signe "égal" suivi
par un nombre. L'équation initiale diffère de cette forme
désirée sous plusieurs aspects: la présence du 4 qui
multiplie le X, le nombre 7 du côté gauche de l'équation,
et le X du côté droit. Chaque étape de la résolution
implique la détection de l'une de ces différences entre
l'expression initiale et l'expression désirée, et oblige à
extraire de la mémoire un opérateur légitimé
servant à la réduction de différences de ce type, puis
à appliquer cet opérateur. Un opérateur légitimé
est un opérateur qui obéit aux règles de l'algèbre
en n'altérant pas la solution de l'équation. Par exemple, les
transformations qui consistent à ajouter une même quantité
des deux côtés de l'équation ou à regrouper les
termes de même nature sont exécutées par des opérateurs
légitimés.
Les étapes de la solution sont habituellement représentées
par des ensembles de "productions" dont chacune est un processus constitué
d'une "condition" et d'une "action" que l'on peut écrire sous la forme:
C > A
Dès lors que le système reconnaît que la condition
C est satisfaite, il réalise l'action A correspondante. Lorsque
les conditions de plusieurs productions sont satisfaites simultanément,
entrent en jeu des règles de priorité que l'on n'examinera
pas ici et qui déterminent laquelle parmi les actions possibles doit
être exécutée. Dans le cas que nous examinons
présentement, les conditions s'expriment par la reconnaissance des
différences entre l'équation existante et l'équation
désirée. Les actions sont des applications de règles
algébriques appropriées. Ainsi le système de productions
permettant de résoudre ce problème, et d'autres qui lui sont
similaires, peut être décrit comme suit:
Si l'équation a la forme "X = N" StopSi "Nombre" est à gauche soustraire "Nombre"
Si "aX" est à droite soustraire "aX".
Si "aX" est à gauche et si a différent de 1, diviser par a.
Ce système de productions possède deux propriétés
qui caractérisent la plupart des activités humaines de
résolution de problèmes telles qu'on peut les étudier
en laboratoire. D'abord il emploie une heuristique très
générale, celle de l'analyse moyens-fins. L'analyse moyens-fins
est mise en oeuvre par le cycle "trouver la différence-appliquer
l'opérateur" que l'on a décrit plus haut. Ensuite la
résolution s'accomplit principalement par reconnaissance ou
re-cognition (9). Autrement dit, les formes particulières de
l'état du problème, après re-cognition, rappellent au
sujet les actions appropriées susceptibles d'être entreprises.
Or toutes les fois que l'on aboutit à une description satisfaisante
des systèmes de productions qui gouvernent la résolution effective
de problèmes dans divers domaines, on découvre presque toujours
qu'ils incluent des méthodes d'analyse moyens-fins et de résolution
par re-cognition. Dans les problèmes difficiles, la solution peut
n'être pas trouvée directement; elle nécessite alors
une troisième procédure: la méthode de recherche
sélective par essai et erreur.
L'analyse moyens-fins et la recherche sélective sont parfois tenues
pour des méthodes faibles, car, bien qu'elles soient largement applicables
à presque tous les types de problèmes, elles ne sont pas toujours
très efficaces tant qu'elles ne sont pas combinées à
de nombreuses connaissances spécifiques associées au domaine
dont relève le problème. C est précisément la
tâche des systèmes de productions et des mécanismes de
re-cognition qu'ils mettent en oeuvre que d'apporter au processus de
résolution les connaissances spécifiques du domaine qui les
rendent efficaces et puissants.
Les experts et l'intuition
Nous disposons aujourd'hui des connaissances requises pour aborder efficacement
- donc en expert - les problèmes relevant des domaines professionnels
usuels. On a montré par exemple qu'un maître ou un
grand-maître aux échecs doit pouvoir stocker dans sa mémoire
plus de 50 000 schémas de dispositions des pièces qu'il peut
reconnaître chaque fois qu'elles lui apparaissent sur un échiquier.
A chacun de ces schémas, il doit associer la connaissance des actions
requises par l'occurrence de l'une d'entre elles. Ainsi lorsqu'un maître
repère sur l'échiquier le schéma connu sous le nom de
"colonne ouverte", il considère immédiatement la possibilité
de déplacer une tour sur cette colonne. Dans tel cas précis,
cela peut ne pas être un mouvement correct, mais c'est toujours un
mouvement qu'il faut considérer lorsque apparaît un tel
schéma. Le fait que les maîtres aux échecs sont capables
de jouer des parties rapides (dix secondes par coup) ou des parties
simultanées contre cinquante joueurs, peut s'expliquer à l'aide
de ces capacités de re-cognition. Leur système de productions
stocke des connaissances sur les échecs telles que la re-cognition
d'une configuration sur l'échiquier suscite la re-cognition d'un processus
qui, dans la plupart des cas, suggère un coup fort acceptable, même
s'il n'est pas nécessairement le meilleur.
Le signe distinctif de l'expert dans un domaine est son intuition, sa capacité à résoudre rapidement les problèmes, souvent sans même pouvoir expliquer comment cette solution lui est venue à l'esprit: c'est exactement ce que nous attendons habituellement d'un expert, étant donné les connaissances organisées en système de productions qu'il possède. La résolution intuitive des problèmes, ou, ce qui revient au même, la résolution par recognition, est un phénomène compréhensible de façon parfaitement naturelle. Il n'y a aucun mystère dans le processus que nous utilisons pour bénéficier d'un accès rapide au contenu d'une encyclopédie, en utilisant l'index. A la vérité, les deux processus sont essentiellement les mêmes.
L'argument selon lequel il y a des modes de pensée fondamentalement
différents, le mode "holistique" et le mode "analytique", repose sur
le contraste entre les cas où les solutions sont trouvées presque
immédiatement et sans recherches conscientes, et les cas qui
requièrent des analyses et des recherches conscientes prolongées.
Mais si le modèle présenté ici est correct, les processus
holistiques - autrement dit les actes de re-cognition - sont un composant
majeur de toutes les résolutions de problèmes, aussi analytiques
et réfléchies qu'elles soient. La fonction de l'analyse - autrement
dit la recherche sélective - est de relier de façon ordonnée
des séquences entières de productions, chacune d'entre elles
étant activée par une action de recognition. Ces liaisons
peuvent parfois constituer un algorithme rapide et puissant, comme dans l'exemple
algébrique cidessus. Pourtant, sauf peutêtre dans
le cas des problèmes les plus simples, il s'agit de recherches
sélectives par heuristiques et par d'autres méthodes "faibles",
y compris les essais suivis d'erreurs et de recommencements.
Les notions holistiques sont associées en particulier à la
capacité de visualisation globale. On assure parfois, par exemple,
qu'un maître aux échecs peut saisir "d'un seul coup d'il"
la structure complète des relations entre les pièces sur un
échiquier. Des études faites sur les mouvements des yeux des
maîtres, pendant qu'ils jouent, montrent pourtant qu'un simple
système de productions déplace l'attention d'une zone à
l'autre de l'échiquier, au fur et à mesure de la reconnaissance
de dispositions familières des pièces. On ne possède
pas d'observations prouvant avec certitude que les êtres humains peuvent
d'un seul coup d'il saisir de façon globale des systèmes
de relations complexes. En revanche, il semble évident qu'ils peuvent
reconnaître des schémas qui leur sont devenus familiers lors
d'expériences antérieures et auxquels ils peuvent accéder
au sein de collections d'informations qu'ils ont stockées en
mémoire.
Le résultat habituel de l'exécution d'une "production" est
de placer quelque nouvelle information dans la mémoire à court
terme, ce qui la rend accessible à la conscience. Les étapes
intermédiaires durant le processus de recognition ne sont pas
elles-mêmes ouvertes à l'attention consciente. Nous pouvons
dire que nous avons reconnu un ami, mais nous ne pouvons généralement
pas dire par quel processus nous l'avons reconnu. C'est là sans doute
que repose notre impression subjective que la résolution de
type holistique - la résolution par re-cognition - est qualitativement
différente de la résolution de type analytique, pendant laquelle
nous sommes attentifs aux étapes intermédiaires, grâce
aux informations que l'exécution d'une séquence complète
de productions nous a présentées. Je ne vois aucune raison
de croire que la distinction entre ces deux modes de pensée présente
des caractéristiques plus fondamentales que celle-là. Ceci
ne veut pas dire que, dans certains domaines, et pour certaines personnes,
la résolution par re-cognition ne soit pas plus familière qu'elle
ne l'est dans d'autres domaines et pour d'autres personnes.
En particulier, on peut penser que la pensée holistique est plus manifeste
dans les domaines où la reconnaissance de l'appartenance d'un
problème à un certain type, constitue une large part du processus
même de résolution, comme par exemple dans la plupart des
diagnostics médicaux simples. C'est d'ailleurs plus fréquemment
le cas pour les personnes expérimentées dans le domaine que
pour les débutants, et pour les problèmes simples plus que
pour les complexes. Mais dans d'autres cas, comme ceux des problèmes
pour lesquels des interactions avec un grand nombre de faits doivent être
examinées, que les algorithmes permettant de les manipuler soient
disponibles ou non, le processus aura un caractère plus analytique;
autrement dit, il semblera plus délibéré et
planifié.
Les deux exemples de domaines de résolution de problèmes que
l'on a discutés jusqu'ici, l'algèbre et les échecs,
sont habituellement considérés comme apparentés à
la culture scientifique et technique plutôt qu'à la culture
littéraire. Une des raisons pour lesquelles ces deux exemples nous
semblent de nature technique vient de ce que ni l'un ni l'autre ne semble
faire un usage essentiel du langage ordinaire. Bien qu'une grande part de
l'activité scientifique soit non-mathematique, nous tendons
à associer le langage mathématique a celui de la science. Le
cas des échecs est sans doute plus problématique, mais son
caractère formel et analytique lui confère d'une certaine
manière l'allure d'un jeu technique.
Ces frontières s'avèrent souvent perfides. Ni la musique, ni
la peinture ne sont mathématiques au sens littéral du mot.
Mais elles n'utilisent pas dans leur ~expression propre le langage naturel,
et la musique peut etre discutée et décrite de façon
très analytique et formalisée. D'un point de vue sociologique
pourtant, les deux appartiennent clairement au monde des "humanités".
Une discussion critique dans l'un et l'autre domaines est conduite pour
l'essentiel au moyen des langues naturelles, complétées seulement
par l'addition d'un vocabulaire spécialisé dont la forme n'est
pas exagérément technique.
Si nous regardons les territoires préférés des
humanités, la littérature, l'histoire, la philosophie, nous
notons le rôle très particulier qu'y joue le langage.
Pour comprendre les relations entre les deux cultures, nous devons nous demander
s'il y a quelque chose de spécifique dans le langage ordinaire; en
particulier, si la pensée exprimée dans ce langage diffère,
de quelque façon qualitative, de la pensée exprimée
par les formalismes des mathématiques, ou encore de la pensée
soumise aux règles formelles d'un jeu comme les échecs.
Dans l'état actuel de nos connaissances sur les processus de la
pensée humaine, je ne crois pas que l'on puisse donner une réponse
définitive à cette question; néanmoins, un bon nombre
d'observations convergentes se sont accumulées depuis vingt-cinq ans.
En particulier, nous disposons désormais d'une masse appréciable
de connaissances sur les traitements d'informations requis pour extraire
les significations de textes écrits dans les langues naturelles.
Le langage est-il différent?
On a parfois proclamé - en particulier le linguiste Noam Chomsky -
que le langage est une donnée interne spécifique de la
compétence humaine, présente dès la naissance. Une
façon de tester cette hypothèse est d'essayer de simuler les
processus que les êtres humains utilisent, pour comprendre le langage:
si l'on y parvient, on peut alors comparer ces processus avec ceux mis en
oeuvre dans la pensée et la résolution de problèmes,
dans les cas oÙ le langage n'est pas impliqué. Cette
stratégie a conduit à de multiples observations qui appuient
la thèse de l'unicité de la langue.
Un grand nombre de programmes ont été écrit qui sont
capables de procéder à l'analyse grammaticale de diverses fractions
de phrases, brèves et longues, en anglais et dans quelques autres
langues. Ces programmes traitent, à l'entrée des chaînes
linéaires de caractères ou de phonèmes, et produisent,
à la sortie, une phrase analysée grammaticalement: un réseau
habituellement arborescent qui révèle les relations entre les
mots constitutifs. Les premiers programmes de traduction étaient
basés sur de telles analyses grammaticales; ils tentaient de remplacer
la phrase analysée dans le langage source par une phrase synonyme
dans le langage d'arrivée. Ces programmes ont été
uniformément désappointant quant à la qualité
des traductions qu'ils produisaient. Les expériences qu'ils ont permis
de réaliser ont montré qu'une traduction ne dépend pas
simplement de relations lexicales et syntaxiques, mais aussi d'une
compréhension des significations.
Plusieurs systèmes spécialisés ont depuis été
élaborés pour "comprendre" la signification des phrases qu'ils
lisent. Un des programmes de ce type parmi les plus connus est celui de Terry
Winograd, le SHRDLU, qui peut comprendre et exécuter des ordres,
donnés en anglais, visant à réarranger des blocs dans
un imaginaire "monde de blocs" auquel SHRDLU a accès. Par exemple,
le système peut comprendre l'ordre: "Mettez le cône bleu sur
le cube rouge", puis élaborer et exécuter un plan qui obéisse
à cet ordre, en déplaçant au besoin d'autres blocs qui
seraient sur son chemin. De même, Gordon Novak a écrit un programme,
ISAAC, qui comprend assez l'anglais pour s'attaquer aux problèmes
que l'on trouve à la fin du chapitre sur la statique dans un manuel
scolaire de physique. John Hayes et moi-même avons écrit un
programme, UNDERSTAND, qui peut interpréter les instructions de
problèmes du type ib puzzle", comme le problème des missionnaires
et des cannibales, ou celui de la Tour de Hanoi. Cette interprétation
est suffisante pour permettre une représentation interne qui, pour
parvenir à une solution, sera transformée par un programme
de résolution de problèmes.
Dans tous ces programmes, le langage à traiter est, en un certain
sens, un langage technique; il n'est certainement pas un langage
littéraire. Le produit de cette "compréhension" est un certain
type de structure relativement abstraite, sur laquelle des raisonnements
ultérieurs peuvent être appliqués. Il existe maintenant
plusieurs programmes, plus adéquats encore à la culture
littéraire, comme ceux qui peuvent extraire d'un conte de fée
pour enfants un résumé de l'intrigue et un compte rendu des
motivations des divers héros. Je ne sais si cela a déjà
été fait, mais il n'y a aucune raison pour que des programmes
de ce type ne puissent pas commenter les émotions des héros
(colère, peur, amour, etc.).
La compréhension des actions humaines et les motivations et les
émotions associées à ces actions constituent des centres
d'intérêt très proches de ceux que cultivent habituellement
les humanités. Il devient intéressant, dès lors, de
se demander si les programmes informatiques qui manipulent des objets comme
ceux-ci sont très différents des programmes qui comprennent
le langage des problèmes de physique ou celui des puzzles. La
réponse est que les uns et les autres sont très similaires
dans leurs structures de base.
Quelle est la portée de la similarité perçue entre les
processus de compréhension des histoires et les processus de
compréhension des problèmes de physique? Cela veut dire, d'abord,
que dans les deux cas, l'information peut être représentée
par des réseaux de symboles et de structures de symboles, ce qu'en
computation nous appelons des structures de listes. Par exemple, pour
comprendre un problème de physique, il peut être nécessaire
de comprendre ce qu'est un levier: cette information sera stockée
dans un schéma, c est à dire une structure de symboles qui
décrit le levier prototype.
De même, pour comprendre un conte de fée, il peut
être nécessaire de comprendre ce qu'est une "histoire".
Cette information, elle aussi, peut être stockée sous la forme
d'une structure de liste qui décrit l'histoire prototype.
La compréhension d'un problème de physique implique la
création en mémoire d'une nouvelle structure de symboles qui
décrit la situation particulière dont relève ce
problème. Les composants de ce schéma du problème sont
des occurrences des schémas prototypes correspondant aux types des
concepts qui sont utilisés dans les problèmes de physique,
comme le levier par exemple.
De la même façon, la compréhension d'une histoire implique
la création en mémoire d'une nouvelle structure de symboles,
de forme arborescente, qui remplacera la chaîne linéaire des
symboles constituant cette histoire par une autre forme révélant
la "grammaire du récit". Les types de connaissances nécessaires
pour comprendre une histoire sont bien sûr assez différents
de ceux qui sont nécessaires pour comprendre un problème de
physique; mais l'organisation abstraite de cette connaissance en mémoire,
et les caractéristiques des processus qui la transforment, peuvent
être fort similaires dans les deux cas. La conclusion que je tire
de cette comparaison des programmes qui manipulent le langage et de ceux
qui résolvent les problèmes, est que ce qu'ils ont en commun
l'emporte sur les particularités qui les différencient.
Qu'il s'agisse de compréhension du langage ou de résolution
de problèmes, les deux types de programme opèrent, pour
l'essentiel, sémantiquement sur les représentations internes
de la situation. Ces représentations internes sont des structures
de listes complexes, qui ne sont ni spécifiquement linguistiques,
mathématiques ou picturales, et qui pourtant constituent une sorte
de langue commune, dans laquelle toutes les significations de tous les types
particuliers de langages peuvent être exprimés.
Lorsque le langage et les mathématiques interagissent
Une tâche qui nécessiterait des compétences à
la fois en langue naturelle et en mathématiques semblerait bien
adaptée à cette mise en valeur des relations entre les deux
cultures. On a déjà discuté d'une tâche de ce
type: celle de la compréhension des problèmes de physique.
Dans ce cas, nous partons d'un problème formulé dans une langue
naturelle, l'anglais ou le français par exemple, et nous terminons
par quelques équations mathématiques à résoudre.
De manière plus générale, on peut dire que tous les
problèmes présentés sous une forme littérale,
ou sous la forme d'un récit, problèmes que l'on peut traiter
en algèbre ou en arithmétique, associent de la même
façon les deux types de langages.
Si l'on retient l'incapacité - ou la répugnance - à
faire des mathématiques comme un des signes de la séparation
entre les deux cultures, nous pouvons nous demander comment apparaît
et se développe cette répugnance. Il ne semble pas - si l'on
se réfère à nombre d'observations anecdotiques - que
l'antipathie à l'égard des mathématiques apparaisse
habituellement lorsque les étudiants apprennent les activités
de base de la manipulation des symboles arithmétiques pour additionner,
soustraire, multiplier ou diviser. Elle semble plutôt se manifester
le jour où le concept d'énoncé d'un "problème"
est introduit pour la première fois. "Jean avait sept pommes, il en
donna trois à Joë. Combien lui en restetil?". Ou:
"Il y a trois ans, Marie était trois fois plus âgée que
Stève. Aujourd'hui, elle est deux fois plus âgée que
lui. Quel âge ont Marie et Stève?".
En supposant que ces anecdotes soient exactes, il y a quelque chose de curieux
dans cette situation: la culture littéraire s'éloigne de la
scientifique juste au moment où le langage s'associe aux abstractions
des mathématiques; alors qu'il s'agit de l'aspect des mathématiques
dont on présume qu'il devrait être le plus agréable aux
esprits portés vers les humanités.
Mettre en équation sans résoudre
Quelques expériences que Jeffrey Paige et moi avons faites il y a
une dizaine d'années éclairent un peu cette curieuse
difficulté. Nous donnions à différents sujets une
série de problèmes présentés sous leur forme
littérale, en leur demandant de les mettre en équation, mais
pas de les résoudre. Un de ces problèmes était le
suivant:
Un homme découpe une planche en deux parties. La longueur de la
première est égale aux deux tiers de la longueur de la planche.
La seco nde partie a quatre pieds de plus que la première. Quelle
était la longueur de la planche?
S'il considère le problème de l'écriture des équations
comme un problème d'analyse grammaticale de phrases énoncées
en langue naturelle, suivi d'une traduction dans le langage algébrique,
le sujet peut procéder comme suit:
Soit X la longueur de la planche. La longueur de la première partie
est (2/3).X ; celle de la seconde est (2/3).X + 4. Donc l'équation
est X = (2/3)X + (2/3)X + 4.
Cette équation est une traduction syntaxique correcte des phrases
constituant le problème. Si vous la résolvez, vous
découvrirez pourtant que la longueur de la planche est -12 pieds ...
longueur quelque peu curieuse pour une planche.
Tous les sujets que nous avions sollicités pour ces expériences
dans notre laboratoire avaient une formation en algèbre du niveau
du baccalauréat; quelques-uns d'entre eux étaient étudiants
en science et en ingénierie. Ils répondirent à la question
de trois façons différentes. Certains produisirent l'équation
donnée ci-dessus. D'autres produisirent une "mauvaise" équation:
X = (2/3)X + (2/3)X - 4, qui avait pourtant l'avantage de conduire à
une valeur positive de la longueur de la planche (soit 12 pieds, donc en
valeur absolue comme précédemment). Le troisième groupe
de sujets, avant d'écrire une équation, se posa la question:
"N'y a-t-il pas une contradiction?" Certes il n'y a pas de véritable
contradiction dans l'énoncé même du problème.
Mais il se peut qu'il y ait une contradiction entre cet énoncé
et la connaissance qu'un étudiant possède des planches du monde
réel.
Notre interprétation de ces résultats fut la suivante: le premier
groupe de sujets, celui qui produisait l'équation "impossible", traitait
l'énoncé du problème de façon presque
entièrement syntaxique. Le deuxième groupe, celui qui
interprétait incorrectement les phrases de l'énoncé,
mais qui produisait une réponse conduisant à une planche
physiquement possible, traitait l'énoncé du problème
de façon sémantique. On créait une sorte de
représentation interne de la planche et de ses deux parties, et on
se servait de cette représentation pour guider la traduction de
l'énoncé du problème. Le troisième groupe de
sujets produisait à la fois une représentation sémantique
et une traduction syntaxique, découvrant ainsi
l'incompatibilité entre ces deux éléments.
Comprendre un problème et un conte de fée
Par la suite, à partir de cette expérience et de quelques autres
qui sont en cours, il est apparu qu'il devait y avoir une corrélation
entre le mode de traitement des énoncés des problèmes
et la capacité à les traiter. Les étudiants de type
"syntaxique" ont généralement les plus grandes difficultés
face à de tels problèmes, alors que les étudiants de
type "sémantique" en ont beaucoup moins; enfin, les étudiants
qui mettent en oeuvre à la fois les deux processus sont ceux qui
réussissent le mieux.
Admettons un moment que ces observations soient confirmées lors
d'expérimentations ultérieures et examinons leurs implications.
On est conduit à présumer que la compétence spécifique
nécessaire pour réussir à traiter les problèmes
donnés sous forme d'énoncés, est la capacité
de créer une représentation "physique" à partir de
l'énoncé en langue naturelle, puis celle d'utiliser cette
représentation pour guider la traduction du langage naturel en
équations. Il est essentiel que le sujet puisse aller et venir entre
les énonces linguistiques et leurs significations sémantiques,
et entre ces significations et leur représentation abstraite sous
forme d'équations. La difficulté, dans de tels problèmes,
réside plus dans la manipulation de leur sémantique que dans
la traduction formelle de leur syntaxe.
Si cette interprétation s'avère exacte, elle permet de comprendre
pourquoi il n'y a pas de différence notable entre l'activité
de compréhension de l'énoncé d'un problème
d'algèbre et l'activité de compréhension d'un conte
de fée. Dans les deux cas, la clef réside dans la capacité
à extraire la signification sémantique enchâssée
dans le langage. Certes des connaissances spécifiques différentes
sont nécessaires dans les deux cas, mais on ne voit pas de
différence fondamentale dans le processus de compréhension.
Nous avons dès lors le droit d'espérer, au minimum, que
l'incompétence dans cet aspect des mathématiques - un des plus
centraux - n'est pas incurable pour quiconque dispose d'une intelligence
générale correcte et d'une culture littéraire de base.
Le scepticisme le plus intense quant aux similitudes entre la pensée
scientifique et la pensée littéraire se manifeste lorsqu'on
discute de la pensée "créative". Que savons-nous des processus
de la pensée créative dans l'un et l'autre domaine?
Pour répondre, nous avons d'abord besoin d'une définition de
la créativité. Généralement, nous attribuons
la créativité à toute production de la pensée
qui présente quelque nouveauté de valeur; dit valeur dit
créativité. On reconnaît deux types de nouveautés:
la nouveauté aux yeux du monde et la nouveauté aux yeux du
créateur. L'invention indépendante de ce qui est déjà
connu ne suscite pas d'habitude de grandes récompenses. Le prix est
décerné au premier inventeur, et quelles que soient les
satisfactions personnelles que le réinventeur indépendant et
tardif puisse trouver dans sa création, il ne reçoit
généralement pas de grande reconnaissance en récompense
de la société.
Pourtant, il n'y a pas de raison de supposer que les processus psychologiques
utilisés par le réinventeur étourdi soient très
différents de ceux du premier inventeur. D'ailleurs, la réussite
dans la réinvention de quelque chose peut constituer la preuve d'une
exceptionnelle capacité d'invention potentielle. Lorsque le jeune
Gauss réinventa la formule de la somme des N premiers entiers, ses
maîtres eurent raison de lui prédire une brillante carrière
créatrice, bien que la formule fût déjà fort connue
à l'époque où Gauss la redécouvrit.
Pour qui a étudié l'algèbre, la résolution d'une
équation algébrique peut rarement être tenue pour Il
créative"; et même dans les parties entre grands-maîtres,
seuls quelques coups occasionnels sont considérés comme
créatifs ou "brillants". Si l'on examine les quelques domaines
d'activité où l'adjectif créatif est utilisé
le plus volontiers, on peut se demander si l'on doit formuler des
hypothèses très différentes de celle dont nous avons
déjà discuté pour décrire ces processus de
créativité. Comme la créativité apparaît
à la fois en art et en science, et puisque nous nous intéressons
plus particulièrement aux similitudes et aux différences entre
ces deux formes de créativité, considérons des exemples
empruntés à l'un et l'autre domaines. Nous utiliserons la
même méthode d'examen que celle que nous avons
appliquée précédemment. Nous considérerons à
la fois des observations empiriques du processus créatif chez les
êtres humains, et des observations résultant de tentatives de
simulations de ces processus à l'aide de programmes informatiques.
La créativité dans les arts
Il y a quelques années, Walter Reitman enregistra les pensées
à voix haute (et le jeu commenté à voix haute) d'un
sujet qui composait une fugue. Comme ce sujet était un compositeur
professionnel, qui envisageait de publier la fugue qu'il produisait, nous
pouvons tenir cette activité comme créative. L'analyse du protocole
de composition révèle des processus de résolution de
problèmes qui nous sont devenus familiers dans les recherches sur
des activités plus structurées: l'analyse moyens-fins, la recherche
sélective, l'extraction d'information par re-cognition. Il n'est pas
nécessaire de postuler quelque autre processus créatif
spécial pour rendre compte de son activité. Le résultat
est créatif, parce qu'il représente une structure nouvelle
et intéressante constituée de matériaux familiers: les
tonalités, les formes rythmiques, les échelles classiques
diachroniques et chromatiques, etc.
La fugue est-elle un problème?
Avant de nous satisfaire de ce résultat, quelques points importants
doivent pourtant être discutés. Tout d'abord, peut-être
tenir l'activité de composition d'une fugue comme un "problème"?
Cette activité n'a pas a priori de résultat aussi bien défini
que celle de la résolution d'une équation. Comment le compositeur
sait-il que sa tâche est finie? On peut dire qu'une activité
est bien structurée lorsque les critères d'exécution
sont simples et bien définis. Et l'on peut dire qu'elle est faiblement
structurée lorsque ces critères sont relativement vagues et
complexes. Pourtant, lorsqu'un compositeur professionnel est confronté
avec un morceau de musique, il n'a aucune difficulté à
reconnaître s'il s'agit ou non d'une fugue, et il lui est seulement
un peu plus difficile de l'évaluer en tant que morceau de musique.
Sans doute aura-t-il quelque mal à justifier complètement ses
critères, surtout pour la dernière évaluation, mais
son jugement sera cependant sûr et définitif. Aussi, lorsqu'il
compose lui-même une fugue, est-il capable de juger s'il a atteint
les objectifs soumis à des contraintes qu'il s'était
personnellement fixés.
Quelques-uns des critères qu'il utilise sont pourtant des critères
esthétiques; ils peuvent dépendre des émotions que la
musique provoque chez un auditeur humain. Si donc nous voulons regarder la
composition d'une musique comme un exercice de résolution de
problèmes, nous devons disposer d'une théorie de l'esthétique
appropriée. C'est pourquoi j'évoquerais à ce propos
la théorie, déjà publiée, de Léonard Meyer,
qui me semble tout à fait recevable.
Selon Meyer, la musique gouverne l'attention parce qu'elle contient des formes
organisées qui peuvent être détectées et reconnues
par l'auditeur. Si ces formes sont d'une complexité appropriée,
(le niveau de complexité dépendant de l'expérience musicale
de l'auditeur, par exemple, et de son aptitude à les reconnaître),
elles retiendront l'attention. Elles susciteront aussi des espoirs, qui seront
ensuite satisfaits ou frustrés, éveillant ainsi l'émotion.
L'expérience musicale est donc tout à la fois une expérience
intellectuelle (une reconnaissance de formes) et une expérience
émotionnelle; et la qualité d'un morceau de musique dépend
sans doute de sa richesse dans l'exploration de ces deux dimensions.
On trouvera bon nombre d'arguments appuyant les théories de
l'esthétique de Meyer aussi bien dans la documentation portant sur
la musique (p.ex. Hindemith à propos de la composition) que sur la
psychologie (p.ex. Berlyne sur l'attention).
Composer, est-ce traiter de l'information?
Au moins en première approximation, donc, nous considérerons
que le problème de la composition peut être formulé en
terme de traitement de l'information.
On a rapporté récemment de nouveaux types d'observations
sur ces questions, et en particulier sur leurs aspects cognitifs. il s'agit
d'abord de programmes informatiques qui sont capables de découvrir
des formes organisées dans des morceaux de musique. Certains de ces
programmes sont basés sur des modèles extraits de la linguistique
moderne: autrement dit, ils "analysent grammaticalement" le flux de notes
musicales selon une structure hiérarchisée de mouvements, de
sections, de motifs, de phrases, d'accords, etc. Vues de façon descendante
("top-down"), les structures résultantes ressemblent beaucoup a celles
qui sont postulées par le musicologue et théoricien de la musique,
Schencker.
Un programme d'analyse musicale développé il y a quelques
années par Sumner et moi, est directement fondé sur la
théorie de 1 a résolution de problèmes et de l'induction
des formes organisées. En particulier, les processus que nous postulons
pour l'analyse de la musique sont ceux que Kotovsky et moi avions
découverts précédemment, alors que nous avions entrepris
d'expliquer et de simuler les processus cognitifs impliqués par certaines
questions rencontrées dans des tests d'intelligence: les " Thurstone
Series Completion Tasks". Tous ces travaux montrent que le contenu cognitif
(mais pas le contenu émotionnel) de la musique peut être
représenté par les mêmes types de structures de liste
que celles que l'on a utilisées pour représenter les textes
en langage naturel et les énoncés de problèmes (10).
L'autre source d'information sur la nature des processus cognitifs mis en
oeuvre dans les arts est celle fournie par les programmes informatiques qui
composent de la musique ou qui dessinent automatiquement. La première
expérimentation de ce type en musique, due à Hiller et Isaacson,
produisit la Suite ILLIAC, vers 1956, puis la Computer Cantata.
L'architecture de ce programme, comme celle des autres programmes de composition
musicale, ressemble beaucoup aux architectures des autres programmes
d'intelligence artificielle que l'on a déjà évoqués.
Au coeur de tous ces programmes, on trouve toujours une capacité
à générer des formes organisées basées
sur une connaissance des formes des constituants sousjacents
(échelles, accords, etc.). Ni moi, ni les auteurs de ces programmes
ne souhaitons devoir vanter les grands mérites artistiques de ces
productions. Mais, pour paraphraser le Dr Johnson, la merveille n'est pas
que le chien danse bien, mais qu'il réussisse effectivement à
danser!
On peut faire des commentaires analogues au sujet des programmes informatiques qui produisent des formes visuelles, encore que, à mon avis, certains d'entre eux aient atteint un niveau de qualité proprement artistique bien supérieur à celui des compositions musicales construites par des programmes informatiques. En particulier, Duane Palyka a écrit plusieurs programmes dont les produits sont vraiment intéressants. L'un d'eux est accroché dans ma demeure depuis plus de dix ans, sans avoir jamais cessé de me plaire.
Ces productions informatiques picturales sont certes nonfiguratives,
comme la musique est de type "absolu". Les programmes automatiques ne se
sont pas encore attaqués à la peinture figurative ou aux
poèmes symphoniques. Leur production nécessiterait que soient
au préalable résolus les mêmes problèmes que ceux
qui devraient l'être pour que l'on puisse produire automatiquement
des oeuvres littéraires, et ceci n'a pas été encore
sérieusement tenté. Néanmoins, ce que l'on vient de
voir à propos de l'analyse grammaticale des écrits indique
quelquesunes des directions selon lesquelles on pourrait avancer.
La créativité scientifique
Johann Kepler, alors qu'il examinait les chiffres donnant les distances des
planètes au Soleil et les périodes de leurs orbites,
découvrit que cette période variait selon la puissance 3/2
de cette distance. Ohm, en insérant des résistances de
différente longueur dans un circuit et en mesurant les intensités,
découvrit que l'intensité variait en raison inverse de la longueur
du fil.
Un programme informatique, BACON, écrit initialement par Patrick LANGLEY,
et développé ultérieurement par Langley, Bradshaw et
moi, peut reproduire ce type de découvertes faites par Kepler ou Ohm.
Autrement dit, en utilisant les mêmes données que celles dont
disposaient les premiers inventeurs, BACON arrive aux même lois. BACON
ne (re)découvre pas seulement la troisième loi de KEPLER ou
la loi d'OHM, mais aussi la loi des gaz parfaits: PV/T = R.
Pour découvrir une relation invariante entre des paires d'objets
(par exemple, la constance du rapport des accélérations d'une
paire d'objets donnée), il postule une propriété invariante
de chacun de ces objets pour rendre compte de cette invariance. De cette
façon, BACON a réinventé le concept de masse inertielle,
d'index de réfraction ou de chaleur spécifique. Il serait donc
difficile de contester la créativité de BACON. Certes, cette
affirmation serait plus convaincante encore si BACON trouvait quelque chose
de complètement nouveau ' qui n'ait jamais été
découvert encore, au lieu de redécouvrir des lois, aussi
significatives soient-elles, qui furent découvertes pour la première
fois il y a plusieurs centaines d'années.
Cependant, je pense qu'une inspection soigneuse du programme BACON
vérifierait que ses réponses ne se sont pas faufilées
accidentellement, mais sont bien de véritables inventions.
Il n'y a pourtant rien de très complexe dans le programme BACON. Son
organisation générale est typique des programmes capables de
conduire une exploration sélective, l'exploration étant
guidée dans ce cas par un petit nombre d'heuristiques qui
déterminent les directions d'explorations les plus prometteuses. il
représente l'information qui lui est ainsi donnée et il l'accumule
dans des structures de listes du type de celles que nous avons déjà
commentées dans le contexte d'autres types de problèmes.
C'est ce caractère très ordinaire qui constitue l'importance
de ce programme. BACON démontre que l'organisation des processus
nécessaires pour faire des découvertes scientifiques est
essentiellement la même que celle qui est requise dans la plupart des
systèmes de résolution de problèmes. Certes, BACON ne
fait qu'un seul type de découvertes et toutes sont induites à
partir de données (data-driven). BACON est
véritablement un pur système d'induction "baconienne". Bien
des découvertes - mais certainement pas toutes - sont faites de cette
façon, c'est-à-dire induites à partir des données,
la plupart des autres étant obtenues par dérivations de
théories. On note d'ailleurs que les lois découvertes par BACON
ont beaucoup plus l'allure de lois descriptives que de lois explicatives.
Ces limitations de la généralité de BACON sont
partiellement compensées par d'autres systèmes de découvertes
que l'on a construits depuis. En particulier, Lenat a conçu le
système AM, qui est davantage piloté par les concepts
que par les données; autrement dit, en partant d'un stock initial
de concepts, AM recherche de nouveaux concepts qu'il peut définir
à partir des premiers. Il possède non seulement des heuristiques
pour générer de nouveaux concepts, mais aussi des critères
pour évaluer 1'"intêrêt" d'un concept, ce qui lui permet
de guider sa recherche en direction des concepts offrant le plus
d'intérêt.
Les comparaisons de ces programmes qui manifestent des qualités
au moins rudimentaires de créativité scientifique avec les
programmes qui créent de la musique ou des oeuvres picturales ne
révèlent entre eux aucune différence qualitative. En
particulier, les heuristiques d'exploration sélectives constituent
bien leur principe organisateur central, et les structures de listes constituent
bien les moyens essentiels mis en oeuvre dans le stockage organisé
de l'information.
Si les recherches en psychologie du traitement de l'information continuent
à mettre en valeur ces bases communes des processus de la pensée
humaine dans tous les domaines où se manifestent intelligence et
créativité, on peut présumer que des solutions au moins
partielles au problème des deux cultures pourront être
développées selon deux voies distinctes. D'une part, nous pouvons
chercher à améliorer les méthodes d'enseignement qui
faciliteront l'accès à des niveaux satisfaisants de culture
scientifique et mathématique àdes fractions beaucoup plus
importantes de la population adulte. D'autre part, aussi diverses que soient
les disciplines, et aussi spécialisées que soient les connaissances
nécessaires pour se sentir à l'aise dans l'une d'elles, les
modes de pensée que toutes partagent doivent devenir un centre
d'intérêt dominant pour chacun des spécialistes. Si nous
ne parvenons pas à partager la substance de nos spécialités,
nous pouvons néanmoins partager la compréhension des moyens
par lesquels nous pensons et créons. Par l'une ou l'autre de ces deux
routes, la communication peut être réouverte entre les arts
et les sciences. J'aimerais commenter succinctement chacune de ces
possibilités.
L'alphabétisation mathématique
Si ces travaux de comparaison des processus de pensée mis en oeuvre
dans les cultures scientifiques et littéraires mettent en valeur des
points communs, nous ne devons pas oublier pour autant ces faits
entêtés que soulignait initialement la question des deux cultures.
Un grand nombre d'adultes intelligents persistent dans un état de
quasi-analphabétisme mathématique et scientifique. En outre,
ils trouvent l'étude des mathématiques désagréable,
et nombreux sont ceux qui tiennent pour excessivement difficile
l'acquisition de nouvelles compétences dans ce domaine. Une des
interprétations possibles de ces faits consiste bien sûr à
convenir qu'il existe vraiment, entre les individus, des différences
fondamentales quant à leurs aptitudes en mathématiques (tenues
pour distinctes de leurs aptitudes intellectuelles générales),
et que nous avons tout simplement échoué jusqu'ici dans nos
recherches pour identifier la nature de ces différences.
Je ne pense pas que nous puissions désormais soutenir cette thèse.
Si de telles différences existaient, nous devrions tenir pour
vraisemblable le fait qu'elles aient quelque chose à voir avec le
processus de construction de représentations physiques non ambiguës
exprimant la signification des énoncés verbaux. C'était,
on s'en souvient, la première étape pour traduire par des
équations l'énoncé d'un problème de physique
ou d'algèbre. Puisque d'importantes recherches sont en cours pour
élucider ces processus, peutêtre disposeronsnous
dans la prochaine décennie d'une connaissance plus assurée
de l'existence ou de la nonexistence de telles différences.
Je crois qu'il n'y a pas d'objectif plus important aujourd'hui, pour la
psychologie de l'éducation, que la conquête d'une
compréhension profonde de ces questions.
Que l'on découvre ou non de telles différences, nous devrons
toujours tenter d'y remédier en rendant accessibles les
mathématiques et les sciences au plus grand nombre possible de gens.
Nous devrons trouver ce qui manque, tant au plan cognitif qu'au plan
émotionnel dans nos systèmes d'enseignement actuels. Et s'il
apparaît de grandes différences entre les aptitudes des individus,
nous devrons découvrir celles de ces capacités qui peuvent
être corrigées et celles qui ne le peuvent pas.
Le fond commun
Si le propre de toute étude est finalement d'acquérir
une meilleure connaissance de l'être humain, sans doute ne
paraîtratil pas surprenant de proposer comme but essentiel
d'une éducation épanouissante une compréhension approfondie
des processus de la pensée humaine. La psychologie joue dès
lors un rôle très particulier dans les communautés
scientifiques, eh proposant un des principaux itinéraires par lesquels
nous pouvons enrichir notre compréhension de nousmêmes.
Cette compréhension des processus de la pensée humaine fournira
une des clefs vers la conception d'institutions qui, dans une société
démocratique imprégnée de technologie, prennent et
exécutent les décisions d'intérêt public. Toute
discussion des institutions politiques repose sur l'hypothèse que
les citoyens peuvent espérer comprendre leur fonctionnement, et sur
la façon dont cette compréhension est affectée par les
modalités de la communication sociale et politique.
La permanence et la réussite de la démocratie contemporaine
impliquent que les représentants du pouvoir législatif soient
capables à la fois de contrôler les experts et d'utiliser
effectivement leurs connaissances. Pour y parvenir, nous disposons de quelques
méthodes désormais consacrées par la tradition:
l'élection publique, l'audition parlementaire, la sagesse de l'expert
devant les tribunaux, l'autorité hiérarchique dans
l'administration. Une part du malaise contemporain et de la perte de confiance
dans les puissantes composantes techniques de nos sociétés
tient à nos doutes quant à l'adéquation de ces
méthodes traditionnelles aux conditions contemporaines de la vie en
société. Seule une compréhension approfondie de la
façon dont l'esprit humain travaille peut nous aider trouver quelques
moyens pour les améliorer.
(1) Note du traducteur. "Les deux cultures de C.P Snow fut diffusé
à partir de 1959 dàns les communautés anglo-saxonnes
où il connut une grande audience. L'ouvrage fut traduit en français,
en 1968, chez l'éditeur J. J. Pauvert.
(2) NDT. En fonction du contexte, on traduira souvent humanité
par littéraire, mais on conservera l'expression les
humanités.
(3) NDT. Suivant le contexte, il faudrait parfois traduire éducation
"libérale" par éducation "littéraire", d'autres fois
par éducation "épanouissante".
(4) NDT. L'expression information processing (traitement de l'information), fréquemment utilisée par H.A. Simon pour caractériser une de ses thèses principales, prend, sous sa plume, un sens relativement spécifique que l'on ne peut réduire à la banalisation de "l'informatique, science du traitement de l'information".
(5) NDT. Computation pour non-numerical computation et
computique pour computer science. L'expression informatique
est devenue si multiforme en français qu'il semble
préférable de revenir à ces identifiants
étymologiquement corrects... et de plus en plus utilisés dans
les communautés scientifiques.
(6) NDT. Cognitive science peut être correctement traduit par
Science de la cognition.
(7) NDT. Nom d'une association pour la recherche en science de la
cognition.
(8) NDT. Traduction de Symbol system hypothesis. Les singuliers sont
importants pour rendre compte de la généralité é
des concepts.
(9) NDT. On proposera par la suite de traduire recognition par
re-cognition plutôt que par reconnaissance, puisque cognition
semble désormais accepté et que reconnaissance a, en
français, trop de significations différentes.
(10) Note de l'auteur. Bien que quelques observations
suggèrent que l'hémisphère droit soit impliqué
dans le traitement des tonalités musicales pures, on doit peut-être
mentionner ici que le traitement des structures musicales (harmonie et
contrepoint) semble être d'abord une fonction de l'hémisphère
gauche. Ceci - et beaucoup d'autres raisons - confirmerait le fait que la
musique emprunte plus à "l'analytique" qu'à "l'holistique".
Mais j'ai déjà suffisamment argumenté contre les
interprétations habituelles de cette distinction.