Yul

Yul (précédemment aussi appelé JULIA ou IULIA) est un langage intermédiaire qui peut être compilé en bytecode pour différents backends.

Le support d’EVM 1.0, EVM 1.5 et Ewasm est prévu, et il est conçu pour être un dénominateur commun utilisable pour ces trois plateformes. Il peut déjà être utilisé en mode autonome et pour « l’assemblage en ligne » dans Solidity et il existe une implémentation expérimentale du compilateur Solidity qui utilise Yul comme langage intermédiaire. Le Yul est une bonne cible pour étapes d’optimisation de haut niveau qui peuvent bénéficier à toutes les plates-formes cibles de manière égale.

Motivation et description de haut niveau

La conception de Yul vise à atteindre plusieurs objectifs :

Les programmes écrits en Yul doivent être lisibles, même si le code est généré par un compilateur de Solidity ou d’un autre langage de haut niveau.
Le flux de contrôle doit être facile à comprendre pour faciliter l’inspection manuelle, la vérification formelle et l’optimisation.
La traduction de Yul en bytecode doit être aussi simple que possible.
Yul doit être adapté à l’optimisation de l’ensemble du programme.

Afin d’atteindre le premier et le second objectif, Yul fournit des constructions de haut niveau comme les boucles for, les instructions if et switch et les appels de fonctions. Ces éléments devraient être suffisantes pour représenter adéquatement le flux de contrôle des programmes assembleurs. Par conséquent, il n’y a pas d’instructions explicites pour SWAP, DUP, JUMPDEST, JUMP et JUMPI sont fournis, parce que les deux premiers obscurcissent le flux de données et les deux derniers obfusquent le flux de contrôle. De plus, les instructions fonctionnelles de la forme mul(add(x, y), 7) sont préférées aux instructions opcode pures telles que 7 y x add mul car dans la première forme, il est beaucoup plus facile de voir quel opérande est utilisé pour quel opcode.

Même s’il a été conçu pour les machines à pile, Yul n’expose pas la complexité de la pile elle-même. Le programmeur ou l’auditeur ne devrait pas avoir à se soucier de la pile.

Le troisième objectif est atteint en compilant les constructions de niveau supérieur en bytecode de manière très régulière. La seule opération non-locale effectuée par l’assembleur est la recherche de noms d’identifiants définis par l’utilisateur (fonctions, variables, …) et le nettoyage des variables locales de la pile.

Pour éviter les confusions entre des concepts comme les valeurs et les références, Yul est typée statiquement. En même temps, il existe un type par défaut (généralement le mot entier de la machine cible) qui peut toujours être omis pour faciliter la lisibilité.

Pour garder le langage simple et flexible, Yul n’a pas d’opérations, de fonctions ou de types intégrés dans sa forme pure. Ceux-ci sont ajoutés avec leur sémantique lors de la spécification d’un dialecte de Yul, ce qui permet de spécialiser Yul pour répondre aux exigences de différentes plateformes et ensembles de fonctionnalités cibles.

Actuellement, il n’existe qu’un seul dialecte spécifié de Yul. Ce dialecte utilise les opcodes EVM en tant que fonctions intégrées (voir ci-dessous) et ne définit que le type u256, qui est le type natif 256-bit de l’EVM. Pour cette raison, nous ne fournirons pas de types dans les exemples ci-dessous.

Exemple simple

Le programme d’exemple suivant est écrit dans le dialecte EVM et calcule l’exponentiation. Il peut être compilé en utilisant solc --strict-assembly. Les fonctions intégrées mul et div calculent le produit et la division, respectivement.

Instruction			Explication
stop()	-	F	arrête l’exécution, identique à return(0, 0)
stop()	-	F	arrête l’exécution, identique à return(0, 0)
add(x, y)		F	x + y
sub(x, y)		F	x - y
mul(x, y)		F	x * y
div(x, y)		F	x / y ou 0 if y == 0
sdiv(x, y)		F	x / y, pour les nombres signés en complément à deux, 0 if y == 0
mod(x, y)		F	x % y, 0 if y == 0
smod(x, y)		F	x % y, pour les nombres signés en complément à deux, 0 if y == 0
exp(x, y)		F	x au pouvoir de y
not(x)		F	bitwise « not » of x (chaque bit de x est annulé)
lt(x, y)		F	1 if x < y, 0 sinon
gt(x, y)		F	1 if x > y, 0 sinon
slt(x, y)		F	1 if x < y, 0 sinon, pour les nombres signés en complément à deux
sgt(x, y)		F	1 if x > y, 0 sinon, pour les nombres signés en complément à deux
eq(x, y)		F	1 if x == y, 0 sinon
iszero(x)		F	1 if x == 0, 0 sinon
and(x, y)		F	par bit « and » of x et y
or(x, y)		F	par bit « or » of x et y
xor(x, y)		F	par bit « xor » of x et y
byte(n, x)		F	le nième octet de x, où l’octet le plus significatif est le 0ième octet
shl(x, y)		C	décalage logique à gauche de y par x bits
shr(x, y)		C	décalage logique vers la droite de y par x bits
sar(x, y)		C	décalage arithmétique signé vers la droite de y par x bits
addmod(x, y, m)		F	(x + y) % m avec une précision arithmétique arbitraire, 0 if m == 0
mulmod(x, y, m)		F	(x * y) % m avec une précision arithmétique arbitraire, 0 if m == 0
signextend(i, x)		F	le signe s’étend du (i*8+7)ème bit en comptant à partir du moins significatif
keccak256(p, n)		F	keccak(mem[p…(p+n)))
pc()		F	position actuelle dans le code
pop(x)	-	F	valeur de rejet x
mload(p)		F	mem[p…(p+32))
mstore(p, v)	-	F	mem[p…(p+32)) := v
mstore8(p, v)	-	F	mem[p] := v & 0xff (ne modifie qu’un seul octet)
sload(p)		F	storage[p]
sstore(p, v)	-	F	storage[p] := v
msize()		F	taille de la mémoire, c.à.d l’indice de mémoire le plus important auquel on accède
gas()		F	gaz encore disponible pour l’exécution
address()		F	adresse du contrat actuel / contexte d’exécution
balance(a)		F	wei balance à l’adresse a
selfbalance()		I	équivalent à balance(address()), mais moins cher

Abréviation	Nom complet
`f`	`BlockFlattener`
`l`	`CircularReferencesPruner`
`c`	`CommonSubexpressionEliminator`
`C`	`ConditionalSimplifier`
`U`	`ConditionalUnsimplifier`
`n`	`ControlFlowSimplifier`
`D`	`DeadCodeEliminator`
`v`	`EquivalentFunctionCombiner`
`e`	`ExpressionInliner`
`j`	`ExpressionJoiner`
`s`	`ExpressionSimplifier`
`x`	`ExpressionSplitter`
`I`	`ForLoopConditionIntoBody`
`O`	`ForLoopConditionOutOfBody`
`o`	`ForLoopInitRewriter`
`i`	`FullInliner`
`g`	`FunctionGrouper`
`h`	`FunctionHoister`
`F`	`FunctionSpecializer`
`T`	`LiteralRematerialiser`
`L`	`LoadResolver`
`M`	`LoopInvariantCodeMotion`
`r`	`RedundantAssignEliminator`
`R`	`ReasoningBasedSimplifier` - highly experimental
`m`	`Rematerialiser`
`V`	`SSAReverser`
`a`	`SSATransform`
`t`	`StructuralSimplifier`
`u`	`UnusedPruner`
`p`	`UnusedFunctionParameterPruner`
`d`	`VarDeclInitializer`

Yul

Motivation et description de haut niveau

Exemple simple

Utilisation autonome

Description informelle de Yul

Syntaxe

Littéraux

Appels de fonction

Déclarations de variables

Affectations

If

Interrupteur

Boucles

Déclarations de fonctions

Spécification de Yul

Restrictions sur la grammaire

Règles de scoping

Spécification formelle

Dialecte EVM

datasize, dataoffset, datacopy

setimmutable, loadimmutable

linkersymbol

memoryguard

verbatim

Spécification de l’objet Yul

Optimiseur de Yul

Séquence des étapes d’optimisation

Exemple complet d’ERC20