Conception du système de temps de vol

Mise à jour : 17 décembre 2023

Introduction

De nombreuses applications de vision industrielle nécessitent désormais des images de profondeur 3D haute résolution pour remplacer ou augmenter l'imagerie 2D standard. Ces solutions s'appuient sur la caméra 3D pour fournir des informations de profondeur fiables afin de garantir la sécurité, en particulier lorsque les machines fonctionnent à proximité des humains. Les caméras doivent également fournir des informations de profondeur fiables tout en fonctionnant dans des environnements difficiles, tels que dans de grands espaces avec des surfaces hautement réfléchissantes et en présence d'autres objets en mouvement. De nombreux produits à ce jour ont utilisé des solutions de type télémètre à basse résolution pour fournir des informations de profondeur pour augmenter l'imagerie 2D. Cependant, cette approche présente de nombreuses limites. Pour les applications qui bénéficient d'informations de profondeur 3D à plus haute résolution, les caméras CW CMOS ToF offrent les solutions les plus performantes du marché. Certaines des fonctionnalités du système activées par CW ToF haute résolution capteur sans souci sont décrites plus en détail dans le tableau 1. Ces fonctionnalités du système se traduisent également par des cas d'utilisation grand public tels que le bokeh vidéo, l'authentification faciale et les applications de mesure, ainsi que par des cas d'utilisation automobile tels que la surveillance de la vigilance du conducteur et la configuration automatisée en cabine.

Tableau 1. Caractéristiques du système de temps de vol en onde continue

Fonction système Facilitateurs
Précision et exactitude de profondeur • Fréquence de modulation

• Schémas de modulation et traitement de profondeur

Dynamique • Bruit de lecture

• Fréquence d'images brute

Facilité d’utilisation • Procédure de calibrage

• Compensation de température

• Surveillance de la sécurité des yeux

Fonctionnement extérieur • Sensibilité à 940 nm

• Puissance et efficacité d'éclairage

Fusion 2D/3D • Taille des pixels

• Images de profondeur et IR 2D

Fonctionnement multisystème • Annulation en pixels de la lumière parasite

• Synchronisation de la caméra

Vue d'ensemble de la caméra à temps de vol CMOS à onde continue

Une caméra de profondeur est une caméra où chaque pixel affiche la distance entre la caméra et la scène. Une technique pour mesurer la profondeur consiste à calculer le temps nécessaire à la lumière pour se déplacer d'une source lumineuse sur la caméra à une surface réfléchissante et revenir à la caméra. Ce temps de trajet est communément appelé temps de vol (ToF).

 

Une caméra ToF est composée de plusieurs éléments (voir Figure 1), notamment :

une source lumineuse, telle qu'un laser à émission de surface à cavité verticale (VCSEL) ou une diode laser à émission latérale, qui émet de la lumière dans le domaine du proche infrarouge. Les longueurs d'onde les plus couramment utilisées sont 850 nm et 940 nm. La source lumineuse est généralement une source diffuse (éclairage d'inondation) qui émet un faisceau de lumière avec une certaine divergence (alias, champ d'éclairage ou FOI) pour éclairer la scène devant la caméra.

  •  un pilote laser qui module l'intensité de la lumière émise par la source lumineuse.
  •  un capteur avec un réseau de pixels qui collecte la lumière renvoyée par la scène et génère des valeurs pour chaque pixel.
  •  une lentille qui focalise la lumière de retour sur le réseau de capteurs.
  •  un filtre passe-bande co-localisé avec la lentille qui filtre la lumière en dehors d'une bande passante étroite autour de la longueur d'onde de la source lumineuse.
  •  est un algorithme de traitement qui convertit les images brutes de sortie du capteur en images de profondeur ou en nuages ​​de points.

On peut utiliser plusieurs approches pour moduler la lumière dans une caméra ToF. Une approche simple consiste à utiliser une modulation à onde continue, par exemple une modulation à onde carrée avec un rapport cyclique de 50 %. En pratique, la forme d'onde laser est rarement une onde carrée parfaite et peut sembler plus proche d'une onde sinusoïdale. Une forme d'onde laser carrée donne un meilleur rapport signal/bruit pour une puissance optique donnée, mais introduit également des erreurs de non-linéarité en profondeur dues à la présence d'harmoniques haute fréquence.

Une caméra CW ToF mesure la différence de temps td entre le signal émis et le signal de retour en estimant le déphasage ϕ = 2πftd entre les fondamentaux de ces deux signaux. La profondeur peut être estimée à partir du déphasage (ϕ) et de la vitesse de la lumière (c) en utilisant :

où fmod est la fréquence de modulation.

Une génération d'horloge circuit dans le capteur contrôle les horloges de pixels complémentaires qui contrôlent respectivement l'accumulation de photocharges dans les deux éléments de stockage de charges (Tap A et Tap B), ainsi que le signal de modulation laser vers le

pilote laser. La phase de la lumière modulée renvoyée peut être mesurée par rapport à la phase des horloges des pixels (voir le côté droit de la figure 1). Le différentiel entre la lumière modulée de retour et la phase de la lumière modulée de retour par rapport à l'horloge de pixel.

En utilisant les principes de détection homodyne, une mesure est effectuée avec plusieurs phases relatives entre l'horloge de pixel et le signal de modulation laser. Ces mesures sont combinées pour déterminer la phase du fondamental dans le signal lumineux modulé de retour. Connaître cette phase permet de calculer le temps nécessaire à la lumière pour voyager de la source lumineuse à l'objet observé et revenir au pixel du capteur.

Avantages des fréquences de modulation élevées

En pratique, il existe des non-idéalités telles que le bruit de photon, le bruit du circuit de lecture et les interférences multi-trajets qui peuvent provoquer des erreurs dans la mesure de phase. Avoir une fréquence de modulation élevée réduit l'impact de ces erreurs sur l'estimation de la profondeur.

Ceci est facile à comprendre en prenant un exemple simple où il y a une erreur de phase ϵϕ— c'est-à-dire que la phase mesurée par le capteur est ϕ̂ = ϕ + ϵϕ. L'erreur de profondeur est alors :

Par conséquent, l'erreur de profondeur est inversement proportionnelle à la fréquence de modulation, fmod. Ceci est illustré graphiquement à la figure 2.

Cette formule simple explique en grande partie pourquoi les caméras ToF avec une fréquence de modulation élevée ont un bruit de profondeur plus faible et des erreurs de profondeur plus petites que les caméras ToF avec une fréquence de modulation plus faible.

Un inconvénient de l'utilisation d'une fréquence de modulation élevée est que la phase s'enroule plus rapidement, ce qui signifie que la plage qui peut être mesurée sans ambiguïté est plus courte. Le moyen courant de contourner cette limitation consiste à utiliser plusieurs fréquences de modulation qui s'enroulent à des vitesses différentes. La fréquence de modulation la plus basse offre une large plage sans ambiguïté mais des erreurs de profondeur plus importantes (bruit, interférences multi-trajets, etc.), tandis que des fréquences de modulation plus élevées sont utilisées en tandem pour réduire les erreurs de profondeur. Un exemple de ce schéma avec trois fréquences de modulation différentes est illustré à la figure 3. L'estimation de profondeur finale est calculée en pondérant les estimations de phase non enveloppées pour les différentes fréquences de modulation, des poids plus élevés étant attribués aux fréquences de modulation les plus élevées.

Si les poids pour chaque fréquence sont choisis de manière optimale, le bruit de profondeur est inversement proportionnel à la moyenne quadratique (rms) des fréquences de modulation choisies dans le système. Pour un budget de bruit de profondeur constant, l'augmentation des fréquences de modulation permet de réduire le temps d'intégration ou la puissance d'éclairage.

Autres aspects du système critiques pour les performances

Il existe de nombreuses caractéristiques système à prendre en compte lors du développement d'une caméra ToF hautes performances, dont certaines sont brièvement décrites ici.

Capteur d'image

Le capteur d'image est un élément clé d'une caméra ToF. Les effets de la plupart des non-idéalités d'estimation de profondeur (par exemple, biais, bruit de profondeur et artefacts de trajets multiples) sont réduits lorsque la fréquence de modulation moyenne du système augmente. Il est donc important que le capteur ait un contraste de démodulation élevé (capacité à séparer les photoélectrons entre la prise A et la prise B) à haute

fréquence de modulation (centaines de MHz). Le capteur doit également avoir une efficacité quantique (QE) élevée dans les longueurs d'onde du proche infrarouge (par exemple, 850 nm et 940 nm), de sorte qu'une puissance optique moindre est nécessaire pour générer des photoélectrons dans le pixel. Enfin, un faible bruit de lecture contribue à la plage dynamique de la caméra en permettant de détecter des signaux de retour faibles (objets lointains ou à faible réflectivité).

uniforme

Le pilote laser module la source lumineuse (par exemple, VCSEL) à une fréquence de modulation élevée. Afin de maximiser la quantité de signal utile au pixel pour une puissance optique donnée, la forme d'onde optique doit avoir des temps de montée et de descente rapides avec des bords nets. La combinaison du laser, du pilote laser et de la disposition des circuits imprimés dans le sous-système d'éclairage est essentielle pour y parvenir. Une certaine caractérisation est également requise pour trouver les paramètres optimaux de puissance optique et de rapport cyclique afin de maximiser l'amplitude du fondamental dans la transformée de Fourier de la forme d'onde de modulation. Enfin, la puissance optique doit également être fournie de manière sûre avec des mécanismes de sécurité intégrés au niveau du pilote laser et du système pour garantir que les limites de sécurité oculaire de classe 1 sont respectées à tout moment.

Optiques

L'optique joue un rôle clé dans les caméras ToF. Les caméras ToF ont certaines caractéristiques distinctes qui entraînent des exigences optiques particulières. Premièrement, le champ d'éclairement de la source lumineuse doit correspondre au champ de vision de la lentille pour une efficacité optimale. Il est également important que l'objectif lui-même ait une ouverture élevée (faible f/#) pour une meilleure efficacité de collecte de la lumière. Les grandes ouvertures peuvent entraîner d'autres compromis autour du vignettage, de la faible profondeur de champ et de la complexité de la conception de l'objectif. Une conception de lentille à faible angle de rayon principal peut également aider à réduire la bande passante du filtre passe-bande, ce qui améliore la réjection de la lumière ambiante et améliore donc les performances en extérieur. Le sous-système optique doit également être optimisé pour la longueur d'onde de fonctionnement souhaitée (par exemple, revêtements antireflet, conception de filtre passe-bande, conception de lentille) afin de maximiser l'efficacité du débit et de minimiser la lumière parasite. Il existe également de nombreuses exigences mécaniques pour garantir que l'alignement optique se situe dans les tolérances souhaitées pour l'application finale.

Gestion de l'alimentation

La gestion de l’alimentation est également d’une importance cruciale dans une caméra ToF 3D hautes performances module conception. La modulation laser et la modulation pixel génèrent de courtes rafales de courants de crête élevés, ce qui impose certaines contraintes à la solution de gestion de l'énergie. Certaines fonctionnalités au niveau du circuit intégré (CI) du capteur peuvent aider à réduire la consommation électrique maximale de l'imageur. Il existe également des techniques de gestion de l'alimentation qui peuvent être appliquées au niveau du système pour réduire les exigences en matière de source d'alimentation (par exemple, batterie ou USB). Les principales alimentations analogiques d'un imageur ToF nécessitent généralement un régulateur avec une bonne réponse transitoire et un faible bruit.

 

Algorithme de traitement de la profondeur

Enfin, une autre grande partie de la conception au niveau du système est l'algorithme de traitement en profondeur. Le capteur d'image ToF produit des données de pixels brutes à partir desquelles les informations de phase doivent être extraites. Cette opération nécessite différentes étapes qui incluent le filtrage du bruit et le dépliage de phase. La sortie du bloc de dépliage de phase est une mesure de la distance parcourue par la lumière du laser à la scène et retour au pixel, souvent appelée distance ou distance radiale.

La distance radiale est généralement convertie en informations de nuage de points, qui représentent les informations pour un pixel particulier par ses coordonnées réelles (X,Y,Z). Souvent, les applications finales n'utilisent que la carte d'image Z (carte de profondeur) au lieu du nuage de points complet. La conversion de la distance radiale en nuage de points nécessite de connaître les valeurs intrinsèques de la lentille et les paramètres de distorsion. Ces paramètres sont estimés lors de la calibration géométrique du module caméra. L'algorithme de traitement de la profondeur peut également produire d'autres informations telles que des images de luminosité active (amplitude du signal laser de retour), des images IR 2D passives et des niveaux de confiance, qui peuvent toutes être utilisées dans des applications finales. Le traitement en profondeur peut être effectué sur le module de caméra lui-même ou dans un processeur hôte ailleurs dans le système.

Une vue d'ensemble des différents composants au niveau du système abordés dans cet article est présentée dans le tableau 2. Ces sujets seront traités plus en détail dans les prochains articles.

Tableau 2. Composants au niveau du système des caméras de temps de vol 3D

Composant de niveau système Fonctionnalités clés
Imageur ToF Résolution, contraste de démodulation élevé, efficacité quantique élevée, fréquence de modulation élevée, faible bruit de lecture
Source d'éclairage Puissance optique élevée, fréquence de modulation élevée, caractéristiques de sécurité oculaire
Optiques Efficacité de collecte de lumière élevée, lumière parasite minimale, bande passante étroite
Gestion de l'alimentation Faible bruit, bonne réponse transitoire, haute efficacité, offre une puissance de crête élevée
Traitement en profondeur Faible puissance, prend en charge différents types d'informations de profondeur de sortie

Conclusion

Les caméras de temps de vol à ondes continues sont une solution puissante offrant une précision élevée pour les applications nécessitant des informations 3D de haute qualité. De nombreux facteurs doivent être pris en compte pour s'assurer que le meilleur niveau de performance est atteint. Des facteurs tels que la fréquence de modulation, le contraste de démodulation, l'efficacité quantique et le bruit de lecture dictent les performances au niveau du capteur d'image. D'autres facteurs sont des considérations au niveau du système, qui incluent le sous-système d'éclairage, la conception optique, la gestion de l'alimentation et les algorithmes de traitement en profondeur. Tous ces composants au niveau du système sont essentiels pour obtenir la plus haute précision 3D Système de caméra ToF. Ces sujets au niveau du système seront traités plus en détail dans les articles suivants.