Sommaire

Les coordonnées en question

La contraction des longueurs

Pour expliquer les résultats négatifs de l'expérience de Michelson et Morley, on peut mentionner l'hypothèse du physicien irlandais George Francis Fitzgerald, qui supposa que les objets en mouvement subissaient une contraction (d'origine électromagnétique mal comprise) dans le sens de leur mouvement.

Cette idée n'était pas complètement absurde puisque l'on venait de comprendre que les atomes étaient composés de particules chargées et que leur cohésion était donc d'origine électromagnétique. Elle n'était cependant pas suffisante et fut approfondie par Lorentz, qui montra, à la toute fin du XIXème siècle, que pour être en accord complet avec les observations, cette contraction des longueurs devait se faire simultanément avec une sorte de "ralentissement du temps".

Plus précisément, Lorentz réussit à construire une théorie cohérente qui expliquait tous les résultats expérimentaux connus, mais en utilisant 11 hypothèses indépendantes, dont l'existence d'une sorte de temps local.

Le système des coordonnées

Pour bien comprendre comment surgit ce temps local, il est nécessaire de considérer d'un peu plus près ce que l'on nomme un système de coordonnées, qui est un ensemble de nombres, dont le choix n'est pas unique, ayant pour but de permettre de localiser quelque chose dans l'espace.

Le monde dans lequel nous évoluons étant en 3 dimensions, nous avons besoin de 3 coordonnées pour nous repérer. Dans une pièce, cela peut être les distances par rapport à deux murs perpendiculaires plus la hauteur par rapport au sol. Le triplet formé de ces trois nombres désigne de manière unique un point de la pièce et permet de calculer la distance entre ce point et celui qui serait désigné par le triplet (0,0,0), l'origine du système de coordonnées. De plus, si l'on connaît les coordonnées de deux points différents, on peut calculer la distance séparant ces deux points.

En physique, on cherche à repérer non pas de simples positions dans l'espace, mais plutôt ce que l'on appelle des événements. Un événement est quelque chose qui a lieu quelque part à un instant donné. On peut donc repérer dans un système de coordonnées spatio-temporel un événement à l'aide des coordonnées spatiales du lieu où il s'est produit et de la date à laquelle il s'est produit. La date est ainsi une "coordonnée temporelle", qui remplit bien le même rôle qu'une coordonnée spatiale, car elle permet non seulement de repérer un événement dans le temps, mais aussi de calculer la "distance temporelle", nommée plus communément "durée", qui sépare deux événements.

Même si, que ce soit pour les distances ou pour les durées, le système de coordonnées utilisé et son origine n'ont aucune influence sur les mesures (chacun d'entre nous garde le même âge quelque soit le calendrier employé pour le calculer), il reste cependant utile de savoir passer d'un système de coordonnées à un autre pour pouvoir communiquer avec des personnes utilisant un système différent du nôtre.

Cela vaut aussi bien pour le temps (décalage horaire par exemple) que pour l'espace (par exemple calcul de la distance entre deux villes connaissant la distance entre chacune d'entre elles et une troisième). Or, puisque en physique on mesure des objets physiques et que le temps est entré dans le jeu, il reste deux choses à prendre en compte :

  • Un système de coordonnées spatiales sera souvent "attaché" à un objet physique et on parlera alors du référentiel lié à l'objet ou à l'observateur
  • Il devient nécessaire de savoir également obtenir les coordonnées d'un événement dans un système de coordonnées spatio-temporel

Les transformations de Lorentz

Le train d'Einstein

Pour essayer de comprendre ces concepts, on peut considérer un problème unidimensionnel, c'est-à-dire deux axes parallèles mobiles l'un par rapport à l'autre. L'un des exemples préférés d'Einstein mettait en jeu un train et un quai.

Si le train avance à une vitesse constante "v", la distance qu'il aura parcouru au bout d'une durée "T" sera donc "v fois T". Autrement dit, dans le système lié au quai, l'arrière du train avait initialement comme coordonnées "(x=0,t=0)", puis il a pour coordonnées "(x= vT,t=T)". Si l'on considère maintenant un voyageur qui se trouvait initialement à l'arrière du train et qui avance à une vitesse "w" constante dans ce dernier, au bout de la même durée, il aura parcouru une distance "w fois T" dans le train.

Ce qui signifie que dans le système lié au train on pourra le repérer par "(x'= wT,t=T)" et dans celui lié au quai "(x=(w+v)T,t=T)" puisqu'il aura parcouru la distance "vT + wT" par rapport au quai.

Le voyageur se déplace à la vitesse "w+v" par rapport au quai. Et de manière générale, étant donné un événement de coordonnées "(x,t)" dans un premier système et "(x',t')" dans un second système mobile à la vitesse "v" par rapport au premier, on peut écrire pour relier ces coordonnées : "x = x' + vt'" et "t = t'"

On a artificiellement introduit un temps "t'" pour munir chacun des systèmes de son propre temps, bien que la seconde égalité traduise l'universalité de ce temps.

Si l'on regarde la distance qui sépare le voyageur de l'arrière du train à l'instant final, on trouvera "wT", que l'on fasse ce calcul avec le système de coordonnées lié au train "(d' = wT - 0)" ou celui lié au quai "(d = (w+v)T - vT)" : la distance est bien une grandeur absolue.

Pour faire ce raisonnement, on a implicitement supposé l'existence d'un temps universel absolu, sur les mesures duquel un observateur lié au train et un autre lié au quai seraient d'accord : les durées sont elles aussi des grandeurs absolues.

La reformulation de Lorentz

Les transformations de Lorentz

Si l'on remplace le train par la Terre, le quai par l'éther et la voyageur par la lumière, on peut appliquer ce raisonnement pour en déduire ce qui avait été précédemment dit : la vitesse de la lumière étant fixée à la valeur c par rapport à l'éther, si la Terre était mobile par rapport à ce dernier, la vitesse de la lumière par rapport à la Terre varierait.

Puisque les expériences très minutieuses de Michelson et Morley n'avaient rien mesuré, il devait y avoir une erreur dans le raisonnement précédent appliqué à la lumière, et c'est comme cela que Lorentz en vint à proposer de modifier les formules précédemment obtenues.

Le facteur "gamma", qui dépend de la vitesse "v" et de celle de la lumière "c", tend vers 1 lorsque "v "est très petite devant "c", alors cette dernière reste la même quelque soit le référentiel utilisé pour la calculer. Mais il fallait pour cela introduire un temps local "t'" qui restait bien mystérieux.

La relativité einsteinienne

La remise en cause de Newton

Albert Einstein

L'électromagnétisme de Maxwell est une théorie très cohérente, qui marche parfaitement, mais qui semble "asymétrique" si on la joint à la cinématique newtonienne. En effet, du fait de la présence d'un référentiel privilégié lié à l'éther, une expérience, dans laquelle un aimant et un conducteur sont en mouvement relatif l'un par rapport à l'autre, ne se décrit pas de la même façon si c'est l'aimant ou le conducteur qui est en mouvement par rapport à l'éther.

Or, comme l'avait très bien compris Einstein, l'éther, en tant que support matériel de la lumière, n'avait que très peu de raisons d'exister, puisqu'il était dénué de toute propriété mécanique, si ce n'est l'immobilité absolue. De plus, même si la cinématique newtonienne n'avait jamais été mise en défaut, elle reposait sur bien plus d'hypothèses ad hoc que la théorie de Maxwell, qui ne postulait, par exemple, pas l'existence de grandeurs absolues.

Persuadé du caractère simple des lois de la physique, Einstein débute donc sa théorie de 1905 par une remise en cause de bien des évidences liées à la cinématique newtonienne (existence d'un espace absolu, d'un temps absolu, ...), à commencer par le caractère absolu de la notion de simultanéité.

Dire que deux événements éloignés d'un observateur sont simultanés ne peut avoir qu'une seule signification pour celui-ci : il a vu au même instant ces événements se produire. Mais si l'on considère un deuxième observateur, mobile par rapport au premier et se dirigeant vers l'endroit où a lieu l'un de ces événements, la lumière voyageant à une vitesse finie, celle qui provient de l'endroit vers lequel il se dirige lui parviendra la première. Cela signifie que, pour ce deuxième observateur, les deux événements ne sembleront pas simultanés.

La simultanéité ne peut donc pas être un concept absolu, valable pour tous. Or, si l'on y pense bien, à un instant donné, l'espace est, par définition, l'ensemble des événements qui semblent simultanés, car l'espace que nous percevons n'est pas un ensemble de points géométriques (qui n'ont pas de réalité physique), mais bien un ensemble d'événements (x,t) tous décrits par le même temps t. Ainsi, si la simultanéité n'est pas un concept absolu, il ne peut donc pas y avoir d'espace absolu, ni de temps absolu, et pas plus de repos absolu pour l'éther, en tous cas dans le cadre de la cinématique newtonienne. L'éther dénué de sa dernière "propriété mécanique" n'a plus lieu d'être. Seul doit subsister le champ électromagnétique tel qu'il est conçu encore aujourd'hui : un milieu continu omniprésent sans support matériel.

Les nouveaux principes d'Einstein

S'étant débarrassé de tous les a priori possibles, Einstein peut ensuite poser sa théorie qui doit également remplacer la cinématique newtonienne. Cependant, bien qu'il renie celle-ci, Einstein tient à garder un principe qu'elle contient et qui lui semble bien plus important que le reste. En effet, son raisonnement l'a conduit à rejeter toute notion d'absolu pour l'espace et le temps.

Cela signifie inévitablement que ce sont des grandeurs "relatives" et semble indiquer que le principe de relativité est une sorte de "super-principe". Or, la version galiléenne épurée de ce principe stipule que les lois de la mécanique sont les mêmes pour tous les observateurs inertiels. Rapprochant ceci de la constatation expérimentale de la constance de la vitesse de la lumière, le raisonnement d'Einstein semble inévitable : le principe de relativité est un principe plus fondamental que toute la cinématique newtonienne.

Formulé comme un "principe d'absolutisme" qui affirme que les lois de la mécanique sont les mêmes pour tous les observateurs inertiels, il doit être élargi pour inclure l'électromagnétisme et la valeur de la vitesse de la lumière dans le vide, étant donné que l'éther n'existe pas et que le champ électromagnétique est son propre support.

Einstein parvint à reconstruire toute une cinématique, et même une dynamique, qui, comme la mécanique newtonienne, vérifie le principe de relativité "restreinte" (car elle ne traite que des observateurs inertiels). Par construction, cette dynamique a l'avantage, par rapport à la théorie de Newton, d'être également compatible avec l'électromagnétisme selon Maxwell et de ne plus utiliser la notion d'action à distance instantanée qui embarrassait tant Newton : la force de Coulomb est devenu un effet, à la limite statique, des équations de Maxwell et résulte donc, tout comme la lumière, de l'existence du champ électromagnétique.

La relativité restreinte montra rapidement qu'elle était vérifiée expérimentalement, même si elle ne s'imposa pas du jour au lendemain. Peu après sa formulation par Einstein, le mathématicien balte Hermann Minkowski la dota d'un formalisme naturel qui lui correspondait et qui reste employé encore aujourd'hui. La notion d'espace-temps était née.

Les conséquences immédiates

L'abandon des hypothèses de Lorentz

La relativité restreinte retrouve les formules de transformations de coordonnées que Lorentz avait proposées, avec cependant beaucoup moins d'hypothèses que lui. Toutefois, la première grande différence est que, pour Einstein, le temps local "t'" de Lorentz n'a rien de mystérieux. Il s'agit tout simplement du temps pour l'observateur attaché au système de coordonnées (x',t'), système tout aussi valable que celui par rapport auquel il est mobile, le système (x,t). Aucun de ces deux temps n'est plus local ou moins réel que l'autre.

L'explication des contractions

Même si de ces formules ressortent toujours les phénomènes de "contraction des longueurs" et de "dilatation temporelle", ils ne sont plus interprétés comme des "effets physiques" et plutôt comme des "illusions d'optique", les durées et longueurs n'étant "proprement mesurées" que dans un référentiel immobile par rapport au système considéré).

Ainsi, il est assez facile de montrer que si, dans un système de coordonnées, un objet mesure une longueur "l", dans un système de coordonnées en mouvement à la vitesse "v" par rapport au premier, le même objet ne semblera pas mesurer la même longueur : l'objet mobile paraîtra contracté, dans la direction de son mouvement, d'un facteur "1/gamma". Et similairement, le temps selon Einstein n'étant plus un absolu, on peut montrer que la durée séparant deux événements ayant lieu au même endroit n'est plus une grandeur absolue et depend du système de coordonnées dans lequel on la mesure. Si la durée est "T" dans le système par rapport auquel le lieu est fixe, alors dans le système en mouvement par rapport au premier, la durée mesurée sera supérieure à "T," le facteur de dilatation étant gamma.

La modification de la formule de composition des vitesses a une implication assez intéressante qui est qu'aucun objet physique massif ne peut dépasser la vitesse de la lumière dans le vide, vitesse qui devient une limite infranchissable. Une bonne compréhension de ce phénomène passe cependant soit par le formalisme minkowskien, soit par le deuxième résultat qu'Einstein publia en 1905 au sujet de sa nouvelle théorie.

L'équivalence masse/énergie

L'élaboration de l'équivalence

Déjà en physique newtonienne, on avait compris que l'énergie n'était pas une grandeur absolue. En effet, une part de celle-ci peut être cinétique, or la vitesse dépend de l'observateur et il en est donc de même de cette énergie cinétique. Ainsi, il est naturel que dans le cadre de la relativité selon Einstein, l'énergie soit également relative.

Cependant, dans un post-scriptum publié quelques mois après son premier article sur la relativité, Einstein démontra un résultat qui allait faire que sa théorie ne se contenterait pas de révolutionner nos conceptions de l'espace et du temps : elle allait également bouleverser notre façon de percevoir la matière et l'énergie. Ce résultat fondamental était l'équivalence entre la masse inertielle et l'énergie, résultat qui allait impliquer que même si elle est en partie relative, l'énergie ne l'est pas complètement.

La démonstration d'Einstein est très courte malgré ses implications révolutionnaires. En quelques lignes, exploitant l'invariance de la vitesse de la lumière, Einstein démontre tout simplement qu'un corps qui émet de la lumière voit sa masse inertielle diminuer d'une quantité égale à l'énergie émise divisée par le carré de la vitesse de la lumière. Il aboutit ainsi à sa fameuse équation "E = mc2".

A partir de cette date, les termes techniques restent les mêmes, cependant, les concepts physiques désignés par les mots "masse" et "énergie" ont complètement changé. Et comme le principe de conservation ne s'applique plus qu'à l'énergie et non à la masse, on peut aller jusqu'à dire que la masse en tant que grandeur physique fondamentale a disparu : la masse n'est qu'une forme particulière d'énergie.

La limite inertielle

Le fait qu'Einstein ait compris que l'inertie d'un corps dépend de son énergie permet d'appréhender plus aisément le caractère de frontière que joue la vitesse de la lumière. En effet, puisque l'inertie traduit la capacité d'un corps à rester dans le même état de mouvement, plus ce corps a une inertie élevée, plus il faut lui fournir d'énergie pour changer sa vitesse d'une quantité donnée. Jusque là, rien de nouveau par rapport à la dynamique newtonienne, et ce n'est que la transcription en mots d'un fait quotidiennement observé : il est plus facile de mettre en mouvement une plume qu'une armoire.

Mais la nouveauté, introduite par la relativité restreinte est le fait que partant d'un objet ayant une certaine inertie et initialement au repos par rapport à nous, plus nous allons lui fournir d'énergie pour l'accélérer, plus son inertie va augmenter, et plus il faudra lui fournir d'énergie pour l'accélérer.

Le résultat qui ressort des équations est sans appel : pour accélérer un objet massif initialement au repos jusqu'à la vitesse de la lumière, il faut lui fournir une énergie infinie. Et quand on dit ici "infinie", il ne s'agit pas d'une sorte de métaphore pour dire "très grande et hors de capacité de nos moyens".

Dans le cas de l'accélération d'un objet dans le cadre relativiste, la seule échelle qui existe est l'échelle de la vitesse de la lumière, et cet infini est donc véritablement infiniment loin et n'a pas le même statut que le premier. C'est un infini de nature qui a un caractère absolu, et qui se comprend d'ailleurs beaucoup mieux dans le cadre de pensée découvert par Minkowki : celui de l'espace-temps quadridimensionnel.

La dilatation temporelle

Les jumeaux de Langevin

L'un des paradoxes les plus connus concernant la relativité restreinte est dû au physicien français Paul Langevin et est souvent nommé paradoxe des jumeaux.

Paul Langenvin

La situation imaginée par Langevin est la suivante : deux frères jumeaux décident de faire une expérience grâce à une fusée pouvant voyager à une vitesse proche de celle de la lumière. L'un d'entre eux reste sur Terre, alors que l'autre part en voyage à une vitesse relativiste. Au bout d'un certain temps, il fait demi-tour et revient vers la Terre à la même vitesse. Le "paradoxe" consiste en ceci que lorsque le jumeau voyageur reviendra sur Terre, il sera plus jeune que son frère resté sur Terre. A partir de là, il existe plusieurs versions concernant "ce qui est paradoxal".

La version la plus simple est celle où, selon le bon sens commun, le paradoxe réside dans le fait que des jumeaux devraient garder le même âge toute leur vie. Mais ceci repose sur une conception de temps absolu et universel que la relativité renie entièrement. Ce n'est donc pas un paradoxe interne à la théorie. En revanche, il peut paraître paradoxal que l'un des jumeaux soit finalement plus âgé que l'autre car, a priori, rien n'interdit de se placer du point de vue du jumeau qui part dans la fusée et de considérer que c'est la Terre qui se déplace : depuis Galilée déjà, le mouvement et la vitesse sont relatifs.

Ainsi, selon un principe de symétrie, on devrait s'attendre à ce que chacun des jumeaux puisse faire le même raisonnement et on ne saurait conclure qui des deux sera réellement plus âgé, ni même s'il y en aura un plus âgé. Or, cet apparent paradoxe n'est pas plus valable que le premier car les deux jumeaux n'ont pas des rôles symétriques. Celui qui part dans la fusée n'est plus un observateur inertiel car il subit des accélérations et des décélérations, alors que celui resté sur Terre n'en subit aucune. Il convient d'ailleurs de ne pas oublier que rien n'interdit dans ce raisonnement à la Terre d'être en mouvement de translation uniforme, elle est supposée inertielle, mais pas immobile, ce qui n'a aucun sens dans l'absolu.

Par conséquent, pour faire des calculs valables dans le cadre de la relativité restreinte, il est nécessaire d'utiliser un système de coordonnées fixe (ou mobile à vitesse constante) par rapport au terrien, puisqu'il est inertiel.

Quelques exemples concrets

Une expérience très similaire a été réalisée à l'aide d'horloges embarquées dans des avions faisant le tour de la Terre en sens contraires avant de revenir à leur point de départ. Pour mettre en évidence l'effet attendu, on peut montrer qu'une précision de l'ordre d'une microseconde (un millionième de seconde) est suffisante. Or, les horloges de pointe actuelles sont tout à fait capables d'arriver à une telle précision et l'effet prédit par la relativité restreinte a bien été observé.

On peut observer la dilation temporelle grâce aux rayons cosmiques, en majorité composés de muons. Ceux-ci nous parviennent de la haute atmosphère à des vitesses très proches de celle de la lumière. Ces muons ont été créés lors de réactions entre les molécules atmosphériques et des particules, éjectées au cours d'événements astrophysiques extrêmement violents, qui ont parcouru plusieurs années-lumière avant de nous parvenir.

Mais les muons ont une propriété très précisément vérifiée lors d'expériences de physique des particules faites au sol (et dans lesquelles ils naissent avec des vitesses moindres) qui est leur instabilité : un observateur qui regarde un muon immobile par rapport à lui le voit se désintègrer en deux millionièmes de seconde. Ainsi, cette propriété étant universelle, aucun muon produit dans l'atmosphère ne devrait nous parvenir, cette durée ne permettant pas à une particule, même à la vitesse c, de parcourir cette distance.

Cependant, cette conclusion repose sur une erreur de raisonnement, qui est que la durée de vie du muon mentionnée auparavant est celle dans un système de coordonnées lié au muon, c'est-à-dire son temps propre de vie. Dans le référentiel lié au sol, la dilatation temporelle joue son rôle et le muon semble avoir une durée de vie d'autant plus longue qu'il se déplace rapidement. L'observation de muons nés dans l'atmosphère est donc une autre preuve de la "réalité" des effets relativistes.