les introuvables HAS textes SISA 2 1 via AD

Les INTROUVABLE H.A.Simon texte n° 2 Document disponible sur le site MCX-APC

Quelques remarques historiques sur

la formation des sciences de la cognition,

Présentées par H.A. Simon

Avertissement : Ce texte, qui ne fut publié qu'en français, présente le grand interet d'un témoignage d'acteur et de pionnier : En 1984 quand il est établi, les sciences de la cognition qui s'étaient progressivement constituées à partir de 1956, commencent à devenir des disciplines scientifiques importantes. Et les contributions de H.A. Simon et de son ami A. Newell dans les 30 premières années du développement de ces "nouvelle science furent certainement décisives. Jusqu'à sa disparition en 2001 , H.A. Simon resta particulièrement actif et productif dans ce domaine (JLM.)

Bien que cela soit parfois difficile, on doit, pour lire correctement l'histoire, faire l'effort de se reporter soi-même dans la période historique considérée, en oubliant tout ce que l'on sait de ce qui a pu en advenir ultérieurement. Le gens qui vécurent le "jour J" du débarquement en France ne savaient pas, ce matin-là, s'ils allaient réussir ou pas : l'affaire aurait pu tourner bien autrement ! On perd tout le suspense de l'histoire, et une bonne part de sa signification, lorsqu'on se remémore trop clairement ce qui advint ensuite.

Car, non seulement les choses auraient pu évoluer différemment, mais pour comprendre comment les gens voyaient les situations qu'ils rencontraient et pourquoi ils avaient telles idées et pas d'autres, on doit garder à l'esprit qu'ils ne bénéficiaient pas de l'éducation d'aujourd'hui qui nous présente rétrospectivement, de façon plus simple et plus claire, les idées sur le passé.

Aussi, bien que cela ne fasse pas partie de mon histoire personnelle, j'aimerais commencer ces remarques par quelques mots sur le 19e siècle. Pour comprendre les développements contemporains, nous devons d'abord nous mettre dans l'état d'esprit des gens qui, au 19e siècle et dans les siècles précédents, réfléchissaient sur les processus de la pensée et du langage humains. Pour eux, le problème "Corps-Esprit" était vraiment un problème fondamental. Il leur semblait littéralement incroyable (beaucoup de choses de la vie semblent incroyables si vous ne cessez d'y penser !) qu'une chose telle qu'un organisme biologique, fait de chair et de sang, puisse faire des choses aussi intangibles, et pourtant aussi complexes et merveilleuses, que de penser et d'avoir des idées.

Le "problème Corps-Esprit" désigne cette profonde perplexité suscitée par l'incongruité de la relation entre la nature de l'esprit, de la pensée et des phénomènes mentaux, d'une part, et la nature du corps et du cerveau, d'autre part. Il y a bien là une incompatibilité radicale entre les deux, et c'est là que l'histoire commence.

Le premier événement de cette histoire de la réconciliation de l'esprit et du cerveau est peut-être l'apparition de cette idée nouvelle qu'il pourrait exister quelque chose telle que la logique symbolique. Certes, cette idée avait été quelque peu préparée par la mathématique, laquelle est concrétisation de la pensée - insertion des pensées dans des symboles concrets que l'on peut écrire sur une feuille de papier -. Mais la logique fit un pas de plus : ce ne sont pas seulement les produits de la pensée - les nombres que l'on introduit et les nombres que l'on obtient - mais quelque chose de relatif au processus lui-même, que l'on peut formaliser. Nous devons cette idée à des gens comme Boole, Venn et Jevons, qui entrevirent l'idée que l'action de penser pouvait être, d'une façon ou d'une autre, concrétisée et mise dans une forme telle que l'on pouvait commencer à en parler avec quelque précision, commencer donc à la caractériser. On peut penser que ce fut là le premier pas vraiment significatif sur notre route.

Lorsqu'on atteint le début de ce siècle, cette idée commence véritablement à fleurir et proliférer. Des systèmes très puissants de logique symbolique commencent à émerger et prennent corps de façon remarquable, en particulier par les travaux de Frege et, un peu plus tard, de Russell et Whitehead. On a là des systèmes, toujours de crayon et de papier, mais néanmoins systèmes de "traitement de l'information" , établis selon des règles très formalisées. Ni magie, ni faux semblants chaque chose peut être prise en compte pour ce qu'elle est, très exactement.

Il restait certes des problèmes à résoudre, y compris quelques contradictions de base dans les premières formulations, mais le degré de précision dans la manipulation des idées était décuplé par rapport à la situation antérieure. Ce monde en développement, dont je peux me souvenir puisqu'il était celui de mes études universitaires, ce monde était essentiellement celui de Whitehead et Russell, celui des premières logiques symboliques.

Certes, nous le savons, d'autres idées aussi étaient dans l'air. Après tout, Babbage avait presque réalisé un ordinateur (computeur) un demi-siècle plutôt ; mais je ne pense pas qu'on y ait beaucoup prêté d'attention avant la seconde guerre mondiale. Nous connaissions les calculatrices de bureau, qui existaient déjà lorsque j'allais à l'université ; il y en avait même quelques-unes à fonctionnement électrique ! L'idée que les nombres pouvaient être manipulés par une machine était donc acquise, mais elle ne donnait qu'une vague idée de ce que pouvait être une réponse possible au "problème Corps-Esprit"... et, en outre, les calculatrices étaient encore très limitées. Elles n'en faisaient guère plus que ce que nous leur disions de faire en appuyant sur un bouton... comme nous le disons de tous les ordinateurs. Nous avions vaguement entendu parler d'un homme nommé Babbage, mais il ne nous serait jamais venu à l'esprit que sa tentative de création d'une machine à calculer eût quelque chose à voir avec le "problème Corps-Esprit" et la nature de la pensée.

Peu avant la seconde guerre mondiale, ces idées commencèrent à fermenter. Ainsi, ceux d'entre nous qui s'intéressaient à ces questions (dans mon cas, ce fut au début des années 40) devinrent attentifs à un article publié en 1928 par un jeune homme appelé John Von Neumann, dans une revue allemande, consacré à une théorie appelée "théorie des jeux".

J'en savais assez pour savoir que, d'une façon ou d'une autre, ce texte était pertinent pour une compréhension des comportements humains et de la pensée humaine. Je me revois en train de lire cet article avec difficulté, mon allemand d'alors n'étant pas aussi bon qu'il aurait dû l'être! Ainsi l'idée qu'il devait y avoir quelques nouvelles façons intéressantes d'étudier le comportement humain commençait à être dans l'air.

C'est alors qu'un jeune homme, appelé Claude Shannon, publia en 1938 un article extrait de son mémoire de maîtrise , article qui montrait comment des circuits électriques pouvaient être analysés en termes d'algèbre booléenne.

Ce qui était surprenant au moins sur un point jusque-là, les circuits électriques étaient des dispositifs physiques que l'on pouvait décrire par des équations mathématiques ; Shannon montrait qu'on pouvait le faire à l'aide de la logique de Boole. En d'autres termes, il était surprenant que l'algèbre de Boole puisse être mise en correspondance avec des circuits électriques, parce que cela pouvait vouloir dire quelque chose sur la nature de la logique et donc, éventuellement, sur la nature de la pensée et de l'esprit. Si la logique était cette chose abstraite et ineffable, comment se faisait-il que l'on puisse construire un appareil physique qui se comporte de la même façon que s'il obéissait aux lois de la logique?

Si l'on pouvait faire cela, ne pouvait-on se demander aussi si le cerveau exécutait simplement les lois de la logique booléenne ? Cette idée apparut en 1943, lorsque Pitts et McCulloch écrivirent leur célèbre article "A logical calculus of the ideas immanent in nervous activity" .

Ils décrivaient un cerveau hypothétique - très hypothétique - à l'aide de neurones considérés comme des mécanismes binaires, susceptibles d'être agencés les uns et les autres de façon à assurer des fonctions mentales d'une complexité définie arbitrairement. Ils proposaient de considérer cela soit comme une métaphore, soit comme une théorie. Je ne sais pas, de façon certaine, ce que fut leur préférence ; mais il est probable qu'il s'agissait plus pour eux d'une théorie de la pensée humaine que d'une métaphore.

Je rencontrai McCulloch pour la première fois, un an ou deux après la publication de cet article que je connaissais donc bien. Gerhard von Bonin, un neuro-physiologiste qui travaillait en liaison avec McCulloch, vivait juste en-dessous de notre appartement de la 57e rue, près de l'Université de Chicago. Il nous invita un soir à descendre pour rencontrer ce personnage qu'était McCulloch. Celui-ci avait une grande barbe rousse... et allait et venait dans la pièce, tout en parlant. C'était un homme à part, un personnage de grande tragédie, comme le devinent ceux qui ont lu ses écrits sur le cerveau. L'un d'eux est intitulé : "Pourquoi le cerveau est-il dans la tête ?";

un autre : "L'iniquité mystérieuse du pécheur qui aspire à la place de Dieu" . Il était passé maître dans l'art de dramatiser ce qu'il avait à dire -

Quel est le sens de ces développements ? il y eut un brassage d'idées au sein du petit groupe de gens qui avaient été exposés à la logique symbolique ; et ce fut certainement par ce chemin que je vins à cette nouvelle façon de penser à propos de l'esprit. A l'Université de Chicago, j'avais entendu dire que les "Principia Mathematica" étaient un grand livre.., aussi, je l'ouvris, au moins pour voir ce genre de texte. L'Université de Chicago avait la chance d'avoir en son sein le philosophe Rudolph Carnap dont j'allais suivre les cours.

Nombre d'entre nous partageaient une même curiosité sur la nature de l'esprit (sans toutefois espérer la satisfaire de leur vivant !). Il s'était ainsi constitué une sorte de collège invisible, un groupe "underground" de gens qui partageaient cet intérêt, et le partageant, partageaient aussi les quelques indications et les quelques nouvelles qu'ils recueillaient peu à peu sur ce thème... des choses à lire et à étudier. Je suis certain que je fus informé de la thèse de Shannon quelques mois à peine après qu'elle fut achevée, bien qu'elle ait été soutenue dans une autre Université, au M.I.T. , où enseignait Norbert Wiener. Ce qui, d'une façon ou d'une autre, était intellectuellement excitant. Nous connûmes l'article de McCulloch-Pitts aussitôt qu'il parut, tout comme le célèbre texte de Rosenblueth, Wiener et Bigelow (1943) : "Behavior, purpose and teleology" . Comment pouvait-on traiter des causes finales, ou des buts, d'un système naturel sans aller au-delà des frontières du naturalisme ?

Mais, jusqu'à la fin de la seconde guerre mondiale, il ne sortit pas grand chose de ces développements. Durant la guerre, nous étions occupés à bien d'autres choses, pourrait-on dire !

Quelques autres développements, qui nous auraient beaucoup intéressés si nous les avions connus, étaient bien sûr classés "secret-défense" pour des raisons de sécurité.

Le plus important d'entre eux fut la mise au point de l'ordinateur digital. Aux Etats-Unis, ces travaux sur l'ordinateur étaient largement financés - comme ils le sont encore - par le Ministère de la Défense. Pendant la seconde guerre mondiale, cet appui était surtout justifié par les besoins en tables balistiques pour l'armement, lesquels conduisirent à la mise en place de véritables organisations de calcul. J'y étais vaguement attentif parce que, lors de mon travail à Berkeley de 1939 à 1942, j'eus à coopérer avec quelques-uns des jeunes mathématiciens qui furent affectés par la suite à 1' "Aberdeen Proving Ground" pour travailler sur ces calculs balistiques. Mais l'information dont je disposais était des plus vagues et je ne pus apprécier sur le champ, les implications de ces développements.

Avec la fin de la guerre, tout cela commença à apparaître au grand jour et nous commençâmes à réaliser que, d'une façon ou d'une autre, les ordinateurs et les servo-mécanismes, tout comme Shannon, Pitts-McCulloch, Rosenblueth, Wiener et Bigelow, appartenaient tous à une même collection d'idées !… A cette époque, je ne crois pas avoir, tant soit peu, entendu parler de Turing, qui avait pourtant passé une année, en 1936 ou 1937, à Princeton avec Von Neumann.

C'est dans l'hiver 44-45 que le livre "The Theory of Games" fut publié. Là encore, il semblait évident que ce texte introduisait quelques nouvelles idées fondamentales à propos des problèmes de l'interaction des individus et des problèmes relatifs à la formation des anticipations quant à l'avenir et le comportement d'autrui. C'est également aussitôt après la guerre que l'Amérique constitua son premier "réservoir de matière grise" , la Rand Corporation (à ne pas confondre avec le constructeur d'ordinateurs, Sperry. Rand).

La Rand fut installée par l'Armée de l'Air à Santa-Monica, en Californie, et devint vite un lieu de rencontre pour un grand nombre de jeunes gens passionnés par les nouveaux ordinateurs, l'économie mathématique, les statistiques mathématiques modernes (qui commençaient juste à se développer) et la théorie des jeux de Von Neumann. La Rand devint notre point de rencontre où, chaque été, se jouait une sorte de "partie tournante" . Les gens arrivaient et entraient dans la partie puis, lorsqu'ils devaient repartir pour d'autres activités, sortaient du jeu. Tout l'été, il y avait ainsi, à la Rand Corporation, un va-et-vient de gens qui constituèrent le noyau d'un collège invisible intéressé par ces idées.

C'est à cette époque que Wiener rassembla les idées que nous plaçons maintenant sous le nom de "cybernétique". Elle aussi avait commencé pendant la guerre, avec le développement des mécanismes à rétro-action, les servo-mécanismes, pour des usages militaires. C'est surtout par la théorie de l'information et de la rétro-action que le travail de Wiener était relié aux idées qui nous préoccupaient. Il soulignait aussi leur relation avec les ordinateurs. Ce sont là trois des quatre composants qu'il aggloméra sous le nom de Cybernétique, le quatrième étant la neuro-physiologie.

Je n'eus pas l'occasion de rencontrer Wiener avant les dernières années de sa vie, probablement pas avant 1956. lI était l'une des personnalités les plus éminentes de la communauté du M.I.T. Il cultivait soigneusement ses oublis et ses inattentions - les histoires abondent à ce propos - et il s'installait avec soin, pour dormir, au premier rang de l'assemblée, dans les conférences auxquelles il assistait (mais il semble bien qu'il entendait une bonne partie de ce qui était dit dans ces conférences !). Je ne l'ai pas beaucoup connu, mais il était très aimé.

Je connaissais beaucoup mieux Shannon, à cette époque. Shannon, qui fut très actif dans la première période de l'Intelligence Artificielle, proposait alors quelques-unes des premières bonnes idées sur les façons dont pourrait fonctionner un programme de jeu d'échecs. Les deux premiers concepteurs de programmes de jeu d'échecs furent d'ailleurs C. Shannon et, avant lui, Allan Turing, en Angleterre.

Ainsi, à la fin de la guerre, les choses bouillonnaient et commençaient à progresser rapidement... et tous les principaux composants des mouvements cybernétiques étaient dans l'air. Peu après la publication de la "Théorie des jeux", j'allais écouter une conférence de Von Neumann aux "Gibbs Lectures" à Chicago (sur le théorème ergodique et non point sur la théorie des jeux ou sur les ordinateurs). Il devint alors, nous le savons tous, très actif dans les domaines de la computation et du développement des ordinateurs.

Ceci nous donne à peu près l'essentiel des bases de l'époque moderne ; je dois pourtant mentionner deux autres événements supplémentaires.

Les gens qui étaient intéressés par les éventuelles implications neurophysiologiques tant de la théorie de Pitts-McCulloch que de l'ordinateur et, de ce fait, par leurs éventuelles implications pour la compréhension de la pensée humaine, organisèrent le "Symposium Hixon" au cours duquel toutes ces questions furent discutées par à peu près tous les acteurs que j'ai mentionnés jusqu'ici et qui y étaient présents. Comme je n'y étais pas moi-même, je ne le connais que par les histoires qui ont circulé sur lui et par les "Actes" qui furent publiés peu après (1951). Il y eut beaucoup de débats et de discours sur le thème du cerveau considéré comme un réseau de neurones. C'est là que Von Neumann donna son premier papier, très connu aujourd'hui, sur la possibilité de concevoir un système auto-organisateur... et la quantité de composants que celui-ci devrait posséder afin de s'organiser lui-même...

Il y eut aussi beaucoup d'échanges sur le cerveau considéré comme quelque chose qui ressemblerait à un réseau booléen. Toutes ces idées étaient déjà bien présentes à la fin des années 40...

Une autre idée, qui est vraiment centrale de nos jours, et que Allen Newell et moi-même avons toujours tenue pour essentielle en ce qui concerne notre propre travail, commençait alors à émerger progressivement au tout début des années 50 : celle qu'un computeur peut vraiment faire beaucoup plus que calculer des nombres... qu'un computeur est, en fait, un système général de traitement de l'information. Il est certain que cette prise de conscience se fit en plusieurs étapes. Il y en eut au moins deux, d'après ce que je m'en rappelle.

La première est liée à la reconnaissance du fait que les computeurs pouvaient obéir à des ordres de commande qui se présentaient sous la forme de listes d'instructions. A l'époque, ces instructions étaient données par des nombres. Vous pouviez dire 21 ou 54 à l'ordinateur, ou quelque chose du même genre, et, aussi surprenant que cela paraisse, l'ordinateur faisait alors quelque chose. Il était donc clair que l'ordinateur ne se contentait pas d'écouter 21 ou 54 : il écoutait et comprenait un certain type d'ordre ou de commande. Il extrayait une signification sémantique de ces nombres et montrait qu'il les comprenait en agissant sur eux. N'était-ce pas vraiment étonnant? Le computeur était capable de faire beaucoup plus que de l'arithmétique : il comprenait un langage, même si ce langage était des plus restreints et n'était qu'un langage de commande. Mais, de ce fait, on percevait qu'il y avait autre chose en jeu que l'arithmétique.

La seconde étape indicative reposa sur notre observation que les computeurs pouvaient représenter d'autres choses que les nombres : des cartes, par exemple.

A la Rand, Allen Newell (et moi-même, en qualité de consultant) avait été lancé dans une expérience ("experiment") qui impliquait la simulation d'une station de surveillance avancée pour la défense aérienne. A cette époque, il n'existait pas d'équipements électroniques pour le faire.., et nous n'avions aucun moyen de reproduire les traces simulées sur un écran-radar. Mais nous disposions de quelques vieilles imprimantes IBM qui pouvaient imprimer des choses sur des feuilles-comptables. Allen Newell dit ceci : "pourquoi n'imprimerions-nous pas ainsi des cartes ?", "nous utiliserons ce papier comme un écran de radar simulé... en imprimant simplement, sur une série de cartes, les états du système. Cela sera très grossier, mais ces cartes contiendront toute l'information et nous pourrons ainsi simuler nos stations d'alerte avancée".

Cette idée qu'un ordinateur pouvait non seulement imprimer des nombres mais aussi des cartes à deux dimensions, était, d'une certaine façon, une proposition sensationnelle qui jetait une lumière nouvelle sur l'ensemble des possibilités d'un computeur. Je dois souligner le fait que d'autres personnes eurent cette idée, vers le milieu des années 50, chacune y parvenant bien sûr par un itinéraire et des expériences différentes.

Turing l'avait même eue plus tôt, dans les années 40. Mais je pense que c'est la conjonction de cette idée - selon laquelle les ordinateurs sont capables de faire toute sorte de computation symbolique, sans se limiter au seul domaine numérique - et des idées précédemment exposées, qui suscita ce changement de "Zeitgeist" , de vision du monde, passant de celle que nous appelons "la cybernétique" à celle que nous pourrions appeler "le traitement de l'information" .

Et je pense qu'il s'agit d'une rupture (shift) fondamentale tant à l'égard de la cybernétique (dont les idées étaient - et sont toujours - celles de la commande automatique, de la rétro-action automatique, avec une formulation essentiellement analogique qui, de plus ne fait appel qu'à des nombres pour ses processus de commande) qu'à l'égard de la théorie de l'information (qui, certes, se présente sous une forme digitale mais s'intéresse à la quantité de nos paroles et non à leur contenu).

Ainsi, la cybernétique inclut la théorie de la rétro-action, la théorie de l'information, le computeur (en tant qu'outil de calcul mathématique) et la neuro-physiologie. Et elle était intéressée par la pensée, mais en tant que processus neuro-physiologique. Certes, il est vrai, comme le proclame la cybernétique, que l'esprit qui habite le corps est un esprit neuro-physiologique... mais c'est seulement après une série de réductions qui nous font aller du niveau macroscopique des pensées complexes au niveau microscopique des neurones.

La nouvelle idée était que l'on pouvait construire une théorie de l'esprit au niveau du traitement de l'information - une théorie où les processus informationnels seraient en quelque sorte les fondements premiers. Ce n'est qu'ultérieurement, lorsque les neuro-physiologues seraient assez forts pour représenter comment le cerveau traite l'information - et cela semble encore bien lointain -' ce n'est qu'à ce moment seulement qu'ils pourraient espérer réduire les processus informationnels élémentaires à leurs équivalents neurologiques.

Au sein de cette problématique générale du traitement de l'information, nous suivons, à notre insu, une leçon que la chimie avait apprise au 19e siècle. Nous pouvons élaborer une théorie chimique complète et effective - capable de venir en aide tant à l'industrie des colorants qu'à celle des explosifs ou beaucoup d'autres encore - sans comprendre les réactions chimiques en termes de physique atomique. Certes, la plupart des chimistes de la fin du 19e siècle (mais pas tous) croyaient que, sous les réactions chimiques, il y avait des atomes ; mais ils étaient parvenus à comprendre ces réactions sans disposer d'une théorie physique des atomes.

Nous avons ici l'exemple de réussite d'une science qui se construit par strates (layers), du haut vers le bas. On pourrait répondre à cela que la chimie, accrochée dans les hauteurs, est descendue au niveau des molécules ; puis, au travers de la physique, a chu dans les sables, voire les sables mouvants, sur lesquels reposait - et repose encore - la théorie atomique ou la physique nucléaire. Mais cela ne se réalisera pas avant le second quart du 20e siècle, soit après une centaine d'années de belles réussites pour la chimie. Ce n'est qu'ensuite que la chimie et la physique se rencontrèrent de manière significative avec la théorie quantique.

En ce qui concerne les relations entre le traitement de l'information et la neuro-physiologie, je pense que le scénario est très semblable à celui dont j'ai raconté l'histoire. Après le milieu des années 50, on a élaboré une nouvelle façon de voir les choses et créé, autour de cela, un nouveau domaine de la science. Tout cela tient aussi par le haut, avec la formulation d'une théorie au niveau des processus de traitement de l'information qui, plus ou moins tôt ou tard, seront réduits (en principe, mais pas nécessairement en pratique) à la neuro-physiologie.

Je suis certain que nous ne pourrons jamais progresser dans la compréhension de l'esprit si nous ne passons pas par le niveau d'une théorie du traitement de l'information. Il faudra sans doute aussi d'autres méthodes et d'autres principes pour montrer comment les neurones peuvent effectuer ces traitements de l'information, mais un tel pont existe à peine encore aujourd'hui.

Quand ce point fut atteint, je pense que nous vîmes que le domaine couvert par la théorie du traitement de l'information était fort vaste et qu'il pouvait être étendu dans plusieurs directions. Tout d'abord, il devait recouvrir le langage, lequel est une manifestation exemplaire de la puissance de la pensée humaine. Si le langage est une partie de ce domaine du traitement des symboles , comme cela est plus que certain, et dès lors que toutes les interactions individuelles et sociales humaines en font un usage abondant - qu'il favorise d'ailleurs -, il en résulte que ces idées du traitement de l'information vont jouer un rôle de plus en plus central dans toutes les sciences humaines.

Il y a ensuite une seconde idée. Idée selon laquelle nous disposions, dès à présent, non seulement d'une théorie qui rend compte de la façon dont un système matériel tel que le cerveau peut produire des symboles, les découper et les agréger - c'est-à-dire, faire, avec des symboles, toutes les opérations impliquées par le traitement de symboles - mais nous avions aussi à notre disposition une voie nous montrant comment d'autres types de machineries, en sus du cerveau, pourraient faire cela : nommément, le computeur.

Et tout cela, bien sûr, nous conduit à l'idée générale que l'intelligence, qu'elle soit enchâssée dans un être humain ou dans un chien ou dans un dauphin ou dans un computeur, trouve ses bases et ses racines dans sa capacité à traiter des symboles.

Sur cette base, nous pouvons bâtir une taxonomie des processeurs de symboles, des systèmes intelligents, dans un monde où l'ordinateur est devenu une nouvelle espèce artificielle. C'est sur cette idée que j'arrêterai mon exposé.