Instruções

Name: Introdução ao Assembly
Availability: InStock

Agora que você entende os registradores e regiões de memória do sBPF, vamos examinar as instruções que os manipulam.

Instruções são as operações fundamentais que seu programa executa — somando números, carregando da memória ou pulando para diferentes localizações.

O que são Instruções?

Instruções são os blocos básicos de construção do seu programa. Pense nelas como comandos que dizem ao processador exatamente o que fazer:

add64 r1, r2: "Somar os valores nos registradores r1 e r2, armazenar o resultado em r1"
ldxdw r0, [r10 - 8]: "Carregar 8 bytes da memória da stack no registrador r0"
jeq r1, 42, +3: "Se r1 for igual a 42, pular 3 instruções para frente"

Cada instrução executa exatamente uma operação e é codificada em exatamente 8 bytes de dados para decodificação instantânea pela VM.

Instruções sBPF trabalham com diferentes tamanhos de dados:

byte = 8 bits (1 byte)
halfword = 16 bits (2 bytes)
word = 32 bits (4 bytes)
doubleword = 64 bits (8 bytes)

A maioria das operações sBPF usa valores de 64 bits (doublewords) já que os registradores são de 64 bits, mas você pode carregar e armazenar tamanhos menores quando necessário para eficiência.

Categorias de Instruções e Formato

Quando você compila código Rust, C ou assembly, a toolchain emite um fluxo de instruções de largura fixa de 8 bytes empacotadas na seção .text do seu ELF.

Cada instrução segue uma estrutura consistente que a VM pode decodificar em uma única passagem:

text

   1 byte    4 bits   4 bits     2 bytes         4 bytes
┌──────────┬────────┬────────┬──────────────┬──────────────────┐
│  opcode  │  dst   │  src   │   offset     │      imm         │
└──────────┴────────┴────────┴──────────────┴──────────────────┘

opcode: Define o tipo de operação. Os 3 bits superiores selecionam a classe da instrução (aritmética, memória, jump, call, exit), enquanto os 5 bits inferiores especificam a variante exata (add, multiply, load, jump-if-equal).
dst: O número do registrador de destino (r0–r10) onde os resultados são armazenados — resultados aritméticos, valores carregados ou retornos de funções auxiliares.
src: O registrador de origem que fornece entrada. Para aritmética de dois operandos (add r1, r2), fornece o segundo valor. Para operações de memória, pode fornecer o endereço base. Para variantes imediatas (add r1, 10), estes 4 bits se incorporam ao opcode.
offset: Um pequeno inteiro que modifica o comportamento da instrução. Para loads/stores, é adicionado ao endereço de origem para alcançar [src + offset]. Para jumps, é um destino de branch relativo medido em instruções.
imm: O campo de valor imediato. Operações aritméticas o usam para constantes (add r1, 42), CALL o usa para números de syscall (sol_log = 16), e operações de memória podem tratá-lo como um ponteiro absoluto.

Categorias de Instruções

Diferentes tipos de instruções usam estes campos de formas específicas:

Movimentação de Dados: Move valores entre registradores e memória:

sbpf

mov64 r1, 42           // Colocar valor imediato 42 em r1
                       // opcode=move_imm, dst=1, src=unused, imm=42

ldxdw r0, [r10 - 8]    // Carregar 8 bytes da stack em r0
                       // opcode=load64, dst=0, src=10, offset=-8, imm=unused

stxdw [r1 + 16], r0    // Armazenar r0 na memória em [r1 + 16]
                       // opcode=store64, dst=1, src=0, offset=16, imm=unused

Aritmética: Realiza operações matemáticas:

sbpf

add64 r1, r2           // r1 = r1 + r2
                       // opcode=add_reg, dst=1, src=2, offset=unused, imm=unused

add64 r1, 100          // r1 = r1 + 100
                       // opcode=add_imm, dst=1, src=unused, offset=unused, imm=100

Fluxo de Controle: Altera a sequência de execução:

sbpf

ja +5                  // Pular 5 instruções incondicionalmente
                       // opcode=jump, dst=unused, src=unused, offset=5, imm=unused

jeq r1, r2, +3         // Se r1 == r2, pular 3 instruções
                       // opcode=jump_eq_reg, dst=1, src=2, offset=3, imm=unused

jeq r1, 42, +3         // Se r1 == 42, pular 3 instruções
                       // opcode=jump_eq_imm, dst=1, src=unused, offset=3, imm=42

Codificação do Opcode

A codificação do opcode captura múltiplas informações além do tipo de operação:

Classe da instrução: Aritmética, memória, jump, call, etc.
Tamanho da operação: Operações de 32 bits vs 64 bits
Tipo de origem: Registrador vs valor imediato
Operação específica: Add vs subtract, load vs store, etc.

Isso cria opcodes distintos para variantes de instruções. Por exemplo, add64 r1, r2 (origem registrador) usa um opcode diferente de add64 r1, 42 (origem imediata). Da mesma forma, add64 e add32 têm opcodes diferentes para diferentes tamanhos de operação.

Operações aritméticas distinguem ainda entre variantes com e sem sinal. udiv64 trata valores como sem sinal (0 a 18 quintilhões), enquanto sdiv64 lida com valores com sinal (-9 quintilhões a +9 quintilhões).

Execução de Instruções

O opcode determina como a VM interpreta os campos restantes.

Quando a VM encontra add64 r1, r2, ela lê o opcode e reconhece isso como uma operação aritmética de 64 bits usando dois registradores:

O campo dst indica que o resultado vai para r1, o campo src especifica r2 como o segundo operando, e os campos offset e immediate são ignorados.

Para add64 r1, 42, o opcode muda para indicar uma operação imediata. Agora dst ainda aponta para r1, mas src torna-se sem significado, e o campo immediate fornece o segundo operando (42).

Operações de memória combinam múltiplos campos de forma significativa:

Para ldxdw r1, [r2+8], o opcode indica um load de memória de 64 bits, dst recebe o valor carregado, src fornece o endereço base, e offset (8) é adicionado para criar o endereço final r2 + 8.

Instruções de fluxo de controle seguem o mesmo padrão:

Quando você escreve jeq r1, r2, +5, o opcode codifica um jump condicional comparando dois registradores. Se r1 for igual a r2, a VM adiciona o offset (5) ao contador de programa, pulando 5 instruções.

O opcode determina quais campos são significativos. O formato da instrução permanece constante: o opcode diz como interpretar cada campo, eliminando modos de endereçamento complexos ou casos especiais.

Chamadas de Função e Syscalls

O mecanismo de chamada do sBPF evoluiu ao longo das versões para maior clareza e segurança. Até o sBPF v3, call imm servia a propósitos duplos: o valor imediato determinava se você estava chamando uma função interna ou invocando uma syscall.

O runtime distinguia entre elas com base na faixa de valores imediatos, com números de syscall tipicamente sendo pequenos inteiros positivos como 16 para sol_log.

A partir do sBPF v3, as instruções foram separadas para comportamento explícito. call off agora lida com chamadas de função internas usando offsets relativos, enquanto syscall imm invoca explicitamente funções do runtime. Essa separação torna as intenções do bytecode claras e permite melhor verificação.

Chamadas indiretas através de callx também evoluíram. Versões anteriores codificavam o registrador de destino no campo imediato, mas a partir da v2, é codificado no campo do registrador de origem para consistência com o formato geral de instrução.

Tabela de Referência de Opcodes

Operações de Load da Memória

opcode	Mnemônico	Descrição
lddw	`lddw dst, imm`	Carregar imediato de 64 bits (primeiro slot)
lddw	`lddw dst, imm`	Carregar imediato de 64 bits (segundo slot)
ldxw	`ldxw dst, [src + off]`	Carregar word da memória
ldxh	`ldxh dst, [src + off]`	Carregar halfword da memória
ldxb	`ldxb dst, [src + off]`	Carregar byte da memória
ldxdw	`ldxdw dst, [src + off]`	Carregar doubleword da memória

Operações de Store na Memória

opcode	Mnemônico	Descrição
stw	`stw [dst + off], imm`	Armazenar word imediato
sth	`sth [dst + off], imm`	Armazenar halfword imediato
stb	`stb [dst + off], imm`	Armazenar byte imediato
stdw	`stdw [dst + off], imm`	Armazenar doubleword imediato
stxw	`stxw [dst + off], src`	Armazenar word do registrador
stxh	`stxh [dst + off], src`	Armazenar halfword do registrador
stxb	`stxb [dst + off], src`	Armazenar byte do registrador
stxdw	`stxdw [dst + off], src`	Armazenar doubleword do registrador

Operações Aritméticas (64-bit)

opcode	Mnemônico	Descrição
add64	`add64 dst, imm`	Somar imediato
add64	`add64 dst, src`	Somar registrador
sub64	`sub64 dst, imm`	Subtrair imediato
sub64	`sub64 dst, src`	Subtrair registrador
mul64	`mul64 dst, imm`	Multiplicar imediato
mul64	`mul64 dst, src`	Multiplicar registrador
div64	`div64 dst, imm`	Dividir imediato (sem sinal)
div64	`div64 dst, src`	Dividir registrador (sem sinal)
sdiv64	`sdiv64 dst, imm`	Dividir imediato (com sinal)
sdiv64	`sdiv64 dst, src`	Dividir registrador (com sinal)
mod64	`mod64 dst, imm`	Módulo imediato (sem sinal)
mod64	`mod64 dst, src`	Módulo registrador (sem sinal)
smod64	`smod64 dst, imm`	Módulo imediato (com sinal)
smod64	`smod64 dst, src`	Módulo registrador (com sinal)
neg64	`neg64 dst`	Negar

Operações Aritméticas (32-bit)

opcode	Mnemônico	Descrição
add32	`add32 dst, imm`	Somar imediato (32-bit)
add32	`add32 dst, src`	Somar registrador (32-bit)
sub32	`sub32 dst, imm`	Subtrair imediato (32-bit)
sub32	`sub32 dst, src`	Subtrair registrador (32-bit)
mul32	`mul32 dst, imm`	Multiplicar imediato (32-bit)
mul32	`mul32 dst, src`	Multiplicar registrador (32-bit)
div32	`div32 dst, imm`	Dividir imediato (32-bit)
div32	`div32 dst, src`	Dividir registrador (32-bit)
sdiv32	`sdiv32 dst, imm`	Dividir imediato (com sinal 32-bit)
sdiv32	`sdiv32 dst, src`	Dividir registrador (com sinal 32-bit)
mod32	`mod32 dst, imm`	Módulo imediato (32-bit)
mod32	`mod32 dst, src`	Módulo registrador (32-bit)
smod32	`smod32 dst, imm`	Módulo imediato (com sinal 32-bit)
smod32	`smod32 dst, src`	Módulo registrador (com sinal 32-bit)
neg32	`neg32 dst`	Negar

Operações Lógicas (64-bit)

opcode	Mnemônico	Descrição
or64	`or64 dst, imm`	OR bit a bit imediato
or64	`or64 dst, src`	OR bit a bit registrador
and64	`and64 dst, imm`	AND bit a bit imediato
and64	`and64 dst, src`	AND bit a bit registrador
lsh64	`lsh64 dst, imm`	Deslocamento à esquerda imediato
lsh64	`lsh64 dst, src`	Deslocamento à esquerda registrador
rsh64	`rsh64 dst, imm`	Deslocamento à direita imediato
rsh64	`rsh64 dst, src`	Deslocamento à direita registrador
xor64	`xor64 dst, imm`	XOR bit a bit imediato
xor64	`xor64 dst, src`	XOR bit a bit registrador
mov64	`mov64 dst, imm`	Mover imediato
mov64	`mov64 dst, src`	Mover registrador
arsh64	`arsh64 dst, imm`	Deslocamento aritmético à direita imediato
arsh64	`arsh64 dst, src`	Deslocamento aritmético à direita registrador

Operações Lógicas (32-bit)

opcode	Mnemônico	Descrição
or32	`or32 dst, imm`	OR bit a bit imediato (32-bit)
or32	`or32 dst, src`	OR bit a bit registrador (32-bit)
and32	`and32 dst, imm`	AND bit a bit imediato (32-bit)
and32	`and32 dst, src`	AND bit a bit registrador (32-bit)
lsh32	`lsh32 dst, imm`	Deslocamento à esquerda imediato (32-bit)
lsh32	`lsh32 dst, src`	Deslocamento à esquerda registrador (32-bit)
rsh32	`rsh32 dst, imm`	Deslocamento à direita imediato (32-bit)
rsh32	`rsh32 dst, src`	Deslocamento à direita registrador (32-bit)
xor32	`xor32 dst, imm`	XOR bit a bit imediato (32-bit)
xor32	`xor32 dst, src`	XOR bit a bit registrador (32-bit)
mov32	`mov32 dst, imm`	Mover imediato (32-bit)
mov32	`mov32 dst, src`	Mover registrador (32-bit)
arsh32	`arsh32 dst, imm`	Desloc. aritm. à direita imediato (32-bit)
arsh32	`arsh32 dst, src`	Desloc. aritm. à direita registrador (32-bit)

Operações de Fluxo de Controle

opcode	Mnemônico	Descrição
ja	`ja off`	Jump incondicional (jump 0 = pular para o próximo)
jeq	`jeq dst, imm, off`	Jump se igual ao imediato
jeq	`jeq dst, src, off`	Jump se igual ao registrador
jgt	`jgt dst, imm, off`	Jump se maior que imediato (sem sinal)
jgt	`jgt dst, src, off`	Jump se maior que registrador (sem sinal)
jge	`jge dst, imm, off`	Jump se maior ou igual ao imediato (sem sinal)
jge	`jge dst, src, off`	Jump se maior ou igual ao registrador (sem sinal)
jset	`jset dst, imm, off`	Jump se bit definido (máscara imediata)
jset	`jset dst, src, off`	Jump se bit definido (máscara de registrador)
jne	`jne dst, imm, off`	Jump se diferente do imediato
jne	`jne dst, src, off`	Jump se diferente do registrador
jsgt	`jsgt dst, imm, off`	Jump se maior que imediato (com sinal)
jsgt	`jsgt dst, src, off`	Jump se maior que registrador (com sinal)
jsge	`jsge dst, imm, off`	Jump se maior ou igual ao imediato (com sinal)
jsge	`jsge dst, src, off`	Jump se maior ou igual ao registrador (com sinal)
jlt	`jlt dst, imm, off`	Jump se menor que imediato (sem sinal)
jlt	`jlt dst, src, off`	Jump se menor que registrador (sem sinal)
jle	`jle dst, imm, off`	Jump se menor ou igual ao imediato (sem sinal)
jle	`jle dst, src, off`	Jump se menor ou igual ao registrador (sem sinal)
jslt	`jslt dst, imm, off`	Jump se menor que imediato (com sinal)
jslt	`jslt dst, src, off`	Jump se menor que registrador (com sinal)
jsle	`jsle dst, imm, off`	Jump se menor ou igual ao imediato (com sinal)
jsle	`jsle dst, src, off`	Jump se menor ou igual ao registrador (com sinal)

Operações de Chamada de Função

opcode	Mnemônico	Descrição
call	`call imm` or `syscall imm`	Chamar função ou syscall
callx	`callx imm`	Chamada indireta (registrador no campo imm)
exit	`exit` or `return`	Retornar de função

Operações de Byte Swap

opcode	Mnemônico	Descrição
be16	`be16 dst`	Byte swap (16-bit)
be32	`be32 dst`	Byte swap (32-bit)
be64	`be64 dst`	Byte swap (64-bit)
le16	`le16 dst`	Bit mask (16-bit)
le32	`le32 dst`	Bit mask (32-bit)
le64	`le64 dst`	No op (64-bit)