Informações

🎓 Curso: Hardware para Programadores (C/C++)

"Não basta o código compilar; é preciso entender como o silício e os elétrons o executam na prática."

Bem-vindo à sua jornada no coração da tecnologia. Este curso foi projetado para capacitar desenvolvedores a compreender como o hardware influencia performance, paralelismo, uso de memória e eficiência em software, com ênfase prática em C/C++.

⚡ Atalhos Rápidos

Trilha de Aulas --- 16 lições modernas englobando arquitetura, CPU, memória e I/O. Iniciar Jornada
Slides Interativos --- Material visual otimizado com transições e suporte Reveal.js. Ver Slides
Quizzes e Prática --- Avalie seu progresso com 160 questões técnicas exclusivas. Testar Conhecimento
Laboratórios e Projetos --- Aplique conceitos de baixo nível em C/C++. Ver Projetos
Exercícios Progressivos --- Das questões conceituais ao desafio prático de código. Praticar Agora
Setup e Ferramentas --- Configurações essenciais para ecossistema C/C++ (GCC/G++). Configurar

🗺️ Mapa da Jornada (Módulos)

O curso está estruturado em 4 Módulos cruciais para desenvolvedores backend/sistemas:

📦 Módulo 1: Fundamentos de Arquitetura de Computadores

Como transformar instruções lógicas em pulso elétrico. - Aulas 01 a 04: Software x Hardware, Representação de Dados, Estrutura de CPU e RISC vs CISC.

📐 Módulo 2: Memória e Performance

A anatomia do estado: velocidade versus capacidade. - Aulas 05 a 08: Hierarquia de Memória, Cache e Localidade, Stack vs Heap, e Memória Virtual.

🧠 Módulo 3: Concorrência e Paralelismo

Vencendo as limitações do chip único. - Aulas 09 a 12: Processos e Threads, Sincronização, Paralelismo no Hardware e Modelo de Memória.

💻 Módulo 4: Armazenamento, I/O e Prática

Onde a velocidade despenca e integrando todos os conceitos. - Aulas 13 a 16: Dispositivos de Armazenamento, Sistemas de Arquivos, I/O e Projeto Final Analítico.

💡 Dicas de Sucesso

Entenda os Ponteiros: No Módulo 2, faremos intenso uso do entendimento de Heap e Call Stack.
Observe o Compilador: Use o Terminal e veja suas saídas; entenda como o código compila nativamente.
Diagramas são o Guia: Utilize as tabelas verdade e fluxogramas para visualizar as decisões arquiteturais.

Pronto para entender o Hardware? Ir para Aula 01

Sobre o Curso

🎓 Hardware para Programadores - A Ponte Entre Silício e Software

Este curso foi idealizado para preencher a lacuna entre código abstrato e os processadores que o executam. Durante 16 aulas focadas, especialmente ricas em exemplos C/C++, você aprenderá a dominar performance, concorrência, otimização de Cache e uso eficiente de Memória.

🎯 Objetivos do Curso

Performance e Arquitetura

Compreender a diferença prática das arquiteturas RISC e CISC, pipeline, ciclo de instrução e como isso impacta seu código compilado.
Uso Avançado de Memória

Dominar a dinâmica entre Stack e Heap, evitar vazamentos (Memory Leaks), dominar ponteiros e entender como o SO gerencia a memória virtual.
Concorrência e Paralelismo

Aprender a operar múltiplos cores com Threads e Processos, tratando condições de corrida com Mutex, Semáforos e conhecendo o Memory Consistency Model.
I/O e Armazenamento

Lidar com a latência de discos (SSD vs HDD vs NVMe), interrupções, system calls e as características críticas da persistência em Bancos de Dados / Backend.

📚 O Que Você Vai Aprender

MÓDULO 1 – Fundamentos de Arquitetura de Computadores

Como o Software Roda no Hardware.
Representação de Dados (Binário, Hex, IEEE 754).
Estrutura e Ciclo de CPU (Control Unit e ALU).
RISC vs CISC (ARM vs x86).

MÓDULO 2 – Memória e Performance

Hierarquia de Memória.
Cache, Localidade (Temporal e Espacial) e False Sharing.
Stack vs Heap e Alocações em C/C++.
Memória Virtual, TLB e Paginação.

MÓDULO 3 – Concorrência e Paralelismo

Diferenças entre Processos e Threads.
Mutex, Semáforos e Prevenção de Deadlocks.
Paralelismo no Hardware (Hyper-threading e GPUs).
Modelo de Memória e Barrier de Instruções.

MÓDULO 4 – Armazenamento e I/O

Latência em Dispositivos de Armazenamento.
Sistemas de Arquivos e Journaling.
I/O, Interrupts e DMA.

MÓDULO 5 – Integração Prática

Projeto Final: Profiling e Análise de Gargalos.

🛠️ Metodologia

Aulas Didáticas

Teoria fundamentada, mesclada com animações e slides construídos com Reveal.js.
Exercícios Progressivos

Listas que abordam problemas teóricos e implementações obrigatórias em C/C++.
Projetos Práticos

Aplicações diretas para solidificar os desafios e observar melhorias tangíveis no tempo de execução.
Quizzes Interativos

Avaliações modulares formatadas com feedback instantâneo para mensurar a retenção do saber.

👨‍🎓 Para Quem é Este Curso

Desenvolvedores Intermediários a Avançados querendo melhorar a eficiência do seu código em linguagens de baixo nível ou alto nível.
Engenheiros Backend / Software.
Entusiastas de C e C++ e programadores que almejam desenvolver embarcados, games e sistemas críticos.

📋 Pré-requisitos

Experiência prévia em programação (variáveis, loops, condicionais, funções).
É recomendável (embora não obrigatório) ter lido ou estudado C/C++.
Um sistema ou máquina virtual Linux (Ubuntu/Debian) configurada para compiladores e debugging.

🎖️ O Que Você Receberá

✅ Domínio do funcionamento da CPU e memória (Cache Hit, Profiling).
✅ Escrita de scripts eficientes e multi-processamento em sintonia fina com hardware.
✅ Autonomia em diagnósticos de performance.

🚀 Comece Agora

Pronto para entender o silício?

Ir para Aula 01 Configurar Ambiente Plano de Ensino

Plano de Ensino: Hardware para Programadores (C/C++)

1. Identificação

Curso: Hardware para Programadores
Carga Horária Estimada: 40 a 60 horas
Público-Alvo: Desenvolvedores de Software, Engenheiros Backend e Estudantes Intermediários

2. Ementa

A disciplina aborda a arquitetura de baixo nível da computação e seu viés no desenvolvimento de software de alta performance, especialmente em C/C++. Envolve representação de dados, fluxo de processamento e RISC/CISC, modelamento de Hierarquia de Memória (Heap, Stack, Memória Virtual), processamento Concorrente e Paralelo (Threads, Condition Variables e Mutex), e Armazenamentos (I/O, File System, Dispositivos).

3. Objetivos

Objetivo Geral

Transmitir de forma prática como a lógica de construção e execução de hardware afeta a camada de software.

Objetivos Específicos

Diagnosticar e aplicar as melhores práticas de gerenciamento de memória em linguagens de baixo nível.
Desenhar arquiteturas multithread eficientes.
Mitigar bottlenecks e vazamentos de memória (Memory Leaks).

4. Conteúdo Programático

Módulo 1: Fundamentos de Arquitetura de Computadores (Aulas 01 a 04)
Módulo 2: Memória e Performance (Aulas 05 a 08)
Módulo 3: Concorrência e Paralelismo (Aulas 09 a 12)
Módulo 4: Armazenamento e I/O (Aulas 13 a 15)
Módulo 5: Integração Prática e Profiling (Aula 16)

5. Metodologia

Abordagem pragmática. Os alunos executarão diagnósticos com ferramentas nativas do sistema Linux e da cadeia de compilação GNU (GCC e GDB). Leituras guiadas via portal MkDocs, seguidas por interações e quizzes, e projetos hands-on a cada etapa.

6. Avaliação

Aferição sistemática, considerando o percentual de acerto sobre os 16 quizzes previstos (10 questões de múltipla escolha cada), bem como submissão dos exercícios propostos com soluções em tempo de execução submetidas aos gabaritos.

7. Bibliografia Recomendada

Patterson, D. A., & Hennessy, J. L. (2014). Computer Organization and Design: The Hardware/Software Interface.
Silberschatz, A., Galvin, P. B., & Gagne, G. (2018). Operating System Concepts.
Stroustrup, B. (2013). The C++ Programming Language.

Aulas

Aulas do Curso

Bem-vindo à seção de aulas! Aqui você encontra todo o conteúdo do curso organizado por módulos.

📚 Módulos do Curso

Módulo 1: Fundamentos de Arquitetura de Computadores ---
Módulo 2: Memória e Performance ---
Módulo 3: Concorrência e Paralelismo ---
Módulo 4: Armazenamento, I/O e Prática ---

Módulo 1 – Fundamentos de Arquitetura de Computadores

Aula 01 - Como o Software Roda no Hardware

Nesta aula introdutória, faremos a descida do nível abstrato (código-fonte) até a realidade elétrica (processador). A compreensão clássica da interface Hardware/Software é o que difere programadores comuns de engenheiros com visão arquitetural.

🏗️ 1. O Abismo entre Código e Silício

Escrevemos software (como C/C++, Java, Python) usando linguagens compreensíveis a humanos, porém processadores processam apenas Sinais Elétricos ou, abstraindo para o domínio digital, Binários (0 e 1).

Como a sua frase printf("Hello World"); chega aos pinos do processador? Através de uma cadeia de ferramentas (Toolchain).

O Processo de Compilação (C/C++)

Linguagens compiladas de baixo nível seguem um caminho determinístico. Veja o diagrama abaixo de como um arquivo .c é fatiado:

graph TD
    A(["Código Fonte (hello.c)"]) --> B("Pré-processador")
    B --> C("Compilador")
    C --> D("Assembly (hello.s)")
    D --> E("Assembler")
    E --> F("Código de Máquina / Objeto (hello.o)")
    F --> G{"Linker"}
    H(["Bibliotecas (libc.a, libc.so)"]) --> G
    G --> I((Executável Binário))

[!INFO] Você sabia? O compilador (ex: GCC) traduz o C/C++ não para 0s e 1s de imediato, mas para Assembly — a representação textual do código de máquina, única para cada arquitetura.

🛠️ 2. Compiladores vs Interpretadores

A forma como seu código vira máquina dita o perfil da performance:

Linguagens Compiladas (C/C++, Rust, Go)Linguagens Interpretadas (Python, Ruby)Linguagens Híbridas (Java, C#)

O código é 100% transformado em binário antes de executar (AOT - Ahead of Time). Pró: Alta velocidade de execução. Hardware direto. Contra: O executável construído em Linux-x86 não roda nativamente em Windows-ARM sem ser recompilado.

Um programa (Interpretador) lê o seu código fonte em tempo de execução e executa as ações simulando o comando subjacente para o S.O. Pró: Roda em qualquer SO que tiver o interpretador. Contra: Muito mais lento, por sofrer overhead da interpretação.

Compilam para um formato intermediário (Bytecode), e a JVM ou CLR as compila JIT (Just-In-Time) na máquina cliente no instante de executar.

📐 3. ISA: O Contrato do Processador

ISA (Instruction Set Architecture) é o dicionário de um processador. É o conjunto de comandos numéricos que o CPU sabe, fisicamente, executar:

Puxar da Memória (LOAD)
Somar (ADD)
Gravar na Memória (STORE)

Todo código, por mais sofisticado que seja, precisa ser reduzido a estas poucas operações ditadas pela ISA para rodar.

gcc -O2 -S hello.ccat hello.smain:
pushq %rbp
movq %rsp, %rbp
leaq .LC0(%rip), %rdi
call puts@PLT

Acima, o output é o assembly x86 do seu C. É a representação literal da série de instruções que formarão a ISA do seu microprocessador Intel/AMD.

🚀 Resumo Prático

Ao usar C/C++, você não lida com um motor intermediário te cobrindo (como a JVM), você escreve algoritmos cuja gestão é delegada ao S.O. e rodada pura em metal.
O programador backend / performance critica deve inspecionar eventuais outputs em Assembly para verificar se a abordagem da linguagem otimiza tempo de registrador.

Pronto para entender profundamente os dados no Módulo Binário?

🎯 Próximos Passos

Acessar Slides

Reveja a apresentação visual desta aula.

Ver Slides da Aula
Quiz

Teste seu entendimento básico com perguntas rápidas.

Responder Quiz
Exercícios

Prática avançada e dissertativa com consulta.

Lista de Exercícios
Projeto

Laboratório prático de codificação em C/C++.

Mini Projeto

Avançar para Aula 02

Aula 02 - Representação de Dados

Ao cruzar a fronteira entre software e a CPU, descobrimos que não existem "Strings" ou "Imagens", existem apenas correntes elétricas ligadas ou desligadas (1s e 0s). Vamos analisar a estrutura sob a ótica de C/C++.

🔢 1. Sistema Binário e Hexadecimal

O computador compreende nativamente a base 2 (Binário). Como a escrita binária é muito longa para os humanos, nós a agrupamos em Blocos de 4 (Base 16 - Hexadecimal).

Bit: 0 ou 1
Byte: 8 bits (00000000 a 11111111, indo de 0 a 255 no decimal)

Por que Hexadecimal é amado pelos desenvolvedores C/C++? Um Byte (8 bits) pode ser perfeitamente representado por exatos dois caracteres Hexadecimais. FF é o mesmo que 11111111.

# Como você lida com Hex no C++?cat var.cppint mascara_de_bits = 0xFF; // Representa 255

🔋 2. Inteiros com e sem Sinal (Unsigned)

Em C/C++, o rigor nos tipos provém diretamente do hardware:

int x = 255;           // Geralmente um int é 32 bits, comportando valores grandes, podendo ser negativo (signed).
unsigned char y = 255; // 8 bits sem sinal (0 a 255)
signed char z = -1;    // 8 bits com sinal (-128 a 127)

No hardware, inteiros negativos são representados usando a regra de Complemento de 2. Para obtermos o binário do -1, invertemos todos os bits de 1 e somamos 1.

[!WARNING] Sempre avalie Overshoot. Um loop usando unsigned int i = 10; while(i >= 0) será um loop infinito, porque quando i atingir 0 e for subtraído, ele NUNCA ficará negativo; ele executará o "Wrap-around" arquitetural, voltando ao valor limite de (4.294.967.295).

🧮 3. Ponto Flutuante (IEEE 754)

Os famosos tipos float e double. O processador possui normalmente um setor dedicado de FPU (Floating Point Unit) para eles.

A representação oficial IEEE 754 os divide em 3 porções:

flowchart LR
    A["Sinal (1 bit)"] --- B["Expoente (8 bits)"] --- C["Fração/Mantissa (23 bits)"]
    style A fill:#ff9999
    style B fill:#99ccff
    style C fill:#ccffcc

O Perigo da Precisão!

[!CAUTION] Ao somar decimais repetidamente, as variações de mantissa geram margens de erro: 0.1 + 0.2 raramente é exatamente 0.3 na FPU, mas sim 0.30000000000000004! Evite comparadores igualitários (==) em floats. Jamais use floats transacionando valores bancários estritos em backend, use estruturas customizadas dimensionais inteiras.

🚀 Resumo Prático

A maneira como você escolhe o tipo primitivo da variável modela a fisionomia do registrador acionado na máquina durante o fetch. Entender o Overflow é a proteção básica contra corrupção lógica do código.

🎯 Próximos Passos

Acessar Slides

Reveja a apresentação visual desta aula.

Ver Slides da Aula
Quiz

Teste seu entendimento básico com perguntas rápidas.

Responder Quiz
Exercícios

Prática avançada e dissertativa com consulta.

Lista de Exercícios
Projeto

Laboratório prático de codificação em C/C++.

Mini Projeto

Avançar para Aula 03

Aula 03 - CPU: Estrutura e Funcionamento

Como as operações chegam e são tratadas pela verdadeira mente do computador? A CPU (Unidade Central de Processamento) não é mágica, ela segue um ciclo de pulso rígido orquestrado pelo Clock.

🏗️ 1. O Triângulo de Ouro: ALU, CU e Registradores

A arquitetura interna da CPU possui 3 órgãos vitais:

ALU (Unidade Lógica e Aritmética): O músculo. Onde as somas, subtrações e portas lógicas (AND/OR/XOR) acontecem fisicamente usando transistores.
CU (Unidade de Controle): O supervisor. Ela diz à ALU o que fazer lendo os "Opcodes" (comandos binários ISA).
Registradores: Pequenos e ultra-rápidos blocos de memória embutidos diretamente no chip. (ex: EAX, EBX, RSP).

# Como você lê valores do processador direto em C?cat register.cint main() {
register int i = 10; // "Dica" para o compilador usar um registrador direto!
return i;
}

🔄 2. O Ciclo de Instrução (Fetch-Decode-Execute)

Cada operação ou linha de código C/C++ que você escreve é processada na cadência do Clock pelo ciclo clássico:

stateDiagram-v2
    [*] --> Fetch
    Fetch --> Decode
    Decode --> Execute
    Execute --> Store
    Store --> Fetch

Fetch (Busca): A CU vai na Memória RAM e busca qual o próximo byte de comando, guiando-se pelo Program Counter (PC).
Decode (Decodifica): A CU traduz o comando para entender o que é ("Ah, é para Somar 5!").
Execute: A ALU recebe os parâmetros e faz a conta física elétron a elétron.
Store (Armazena): O resultado volta para um registrador ou para a Memória RAM.

⚡ 3. Pipeline e Previsão de Desvio (Branch Prediction)

Seu processador não faz essas 4 etapas de forma burra (uma por vez). Ele usa Pipelining: Enquanto a Instrução A está em Execute, a Instrução B já está em Decode e a Instrução C está em Fetch!

O perigo do "IF"

Quando você usa muitos if(), o processador tenta "Adivinhar" o lado do if usando heurísticas para não frear o Pipeline (Isso é o Branch Prediction).

[!WARNING] Errar a adivinhação do if corrompe todo o Pipeline que foi pré-carregado. Em código de alta performance C++, tentamos escrever loops minimizando saltos condicionais imprevistos.

🚀 Resumo Prático

Registradores são seus maiores amigos de performance. Códigos C++ que permitem ao compilador prender cálculos pesados 100% dentro dos Registradores rodam em Nanossegundos, contra Milissegundos lendo sempre pela RAM.

🎯 Próximos Passos

Acessar Slides

Reveja a apresentação visual desta aula.

Ver Slides da Aula
Quiz

Teste seu entendimento básico com perguntas rápidas.

Responder Quiz
Exercícios

Prática avançada e dissertativa com consulta.

Lista de Exercícios
Projeto

Laboratório prático de codificação em C/C++.

Mini Projeto

Avançar para Aula 04

Aula 04 - Arquiteturas RISC vs CISC

Por muito tempo, o ecossistema PC foi dominado pela Intel (CISC), enquanto celulares e embarcados (Raspberry Pi/STM32) focavam em ARM (RISC). Mas as linhas se cruzam hoje, especialmente com hardwares como a linha M da Apple operando em RISC com performance altíssima.

🥊 1. Entendendo a Batalha

A grande revolução do backend é: Seu deploy de aplicação na AWS/Azure precisa ser em instâncias baseadas em AMD/Intel x86 (CISC) ou instâncias AWS Graviton ARM (RISC), que normalmente são mais baratas?

CISC (Complex Instruction Set Computer)RISC (Reduced Instruction Set Computer)

Fios de Cabelo: Possui instruções complexas que podem realizar tarefas gigantescas de uma vez (ex: "Leia da memória X, mude o bit Y, grave em Z" em apenas UMA instrução assembly). Reis do pedaço: Processadores Intel e AMD (x86_64). Características: Hardware muito complexo, consome mais energia para decodificar instruções multiformes.

Lâmina Fina: Possui pouquíssimas instruções, todas rápidas, simples e uniformes. Fazer "Leia da memória X, mude o bit Y, grave em Z" leva 3 a 4 comandos curtos no assembly. Reis do pedaço: Arquitetura ARM (Snapdragon, Apple Silicon M1-M3, AWS Graviton). Características: Consome pouca bateria e se destaca muito em Pipelines agressivos.

🖨️ 2. Como isso afeta o Compilador C/C++?

Como programador, ao compilar nosso software, a Target Architecture é o divisor de águas:

# Compilando para a máquina local (digamos, x86_64 CISC)gcc app.c -o app# Compilando Cruzado (Cross-Compiling) de um PC x86 para rodar num Raspberry Pi (ARMv8):aarch64-linux-gnu-gcc app.c -o app_arm

O código C++ original app.c não muda! Quem rala é o compilador, que na versão ARM gera dezenas de pequenas instruções curtas RISC, e na versão local gera um op-code gigante com microcódigos CISC internos da Intel.

[!TIP] Na nuvem: A maioria dos serviços modernos baseados no Docker é Cross-Platform, mas as imagens contínuas não! Seu Dockerfile ou sua build em Go e Rust deve explicitamente compilar para as duplas natividades quando for fazer Load Balancer entre instâncias AWS Graviton (ARM) e Padrão (x86).

🚀 Resumo Prático

Historicamente, servidores eram puramente CISC (Intel).
Hoje, o mercado clama por RISC graças à sustentabilidade térmica (menos energia e calor).
Um bom engenheiro percebe que a ISA (aula anterior) CISC vai conter milhares de comandos Assembly, requerendo compiladores muito agressivos, enquanto a ISA RISC exigirá compiladores muito detalhistas e otimizados linearmente na alocação de registradores C/C++.

Caminho livre até aqui? Então agora vamos adentrar nas dores da "Memória".

🎯 Próximos Passos

Acessar Slides

Reveja a apresentação visual desta aula.

Ver Slides da Aula
Quiz

Teste seu entendimento básico com perguntas rápidas.

Responder Quiz
Exercícios

Prática avançada e dissertativa com consulta.

Lista de Exercícios
Projeto

Laboratório prático de codificação em C/C++.

Mini Projeto

Avançar para Aula 05

Módulo 2 – Memória e Performance

Aula 05 - Hierarquia de Memória

A memória é o maior gargalo oculto no software moderno de alta concorrência. Quanto mais próximo o dado está da CPU, mais rápido é o acesso. Mas a velocidade custa dinheiro e escala térmica.

🏛️ 1. A Pirâmide de Alta Performance

Um programador ingênuo acha que "variável vai na memória". Um engenheiro de software C/C++ sabe em qual camada a variável se hospeda:

graph TD
    A("Registradores<br/>(1 Ciclo - Alguns Bytes)") --> B["Cache L1<br/>(~4 Ciclos - ~64KB a 128KB)"]
    B --> C["Cache L2 e L3<br/>(~12 a ~40 Ciclos - Megabytes)"]
    C --> D[["RAM (Memória Principal)<br/>(~200 a ~300 Ciclos - Gigabytes)"]]
    D --> E[("Armazenamento (SSD / HDD)<br/>(Milhões de Ciclos - Terabytes)")]

    style A fill:#ff9999
    style B fill:#ffcc99
    style C fill:#ffff99
    style D fill:#ccffcc
    style E fill:#99ccff

[!IMPORTANT] A latência é o tempo que demora da CPU pedir um dado até ele chegar. Buscar um byte da RAM demora ~200 ciclos. Buscar do SSD demora centenas de milhares. Essa diferença grotesca é mitigada pelo uso de Caches.

⏳ 2. Os Impactos da Latência (Lado do Código)

Quando escrevemos um código com constantes consultas não linearizadas ao Banco de Dados (ou SSD local), pagamos a mais cara taxa processual: o I/O disk penalty.

# Como consultar as camadas do processador Linuxlscpu | grep CacheL1d cache: 64 KiB
L1i cache: 64 KiB
L2 cache: 1 MiB
L3 cache: 12 MiB

A instrução e os dados descem da L3, saltam para L2, descem para L1 e se acoplam na ALU.

🎯 3. Optimizando Uso

Por que linguagens como C e C++ dominam infraestrutura de servidores High Frequency Trading? Porque elas permitem Alocação Estática e Constante que é perfeitamente "encaixada" pelo compilador diretamente na memória Cache.

Ao invés de carregar gigabytes de Strings na lenta RAM, as linguagens de baixo nível incentivam o uso de matrizes de tamanho delimitado (arrays fixos), cujo agrupamento contíguo força a arquitetura de Hardware Prefetching a adiantar os bytes do Array para a Cache nativamente, antes mesmo de você rodar a linha do código!

🚀 Resumo Prático

Se processadores hoje são mísseis atingindo +4GHz, a RAM parou no tempo (Latência de CAS não baixa proporcionalmente).
Tudo recai na técnica humana de amarrar dados juntos (Caches L1 e L2) e escrever data-oriented code se quiser ultra-latência C++.

🎯 Próximos Passos

Acessar Slides

Reveja a apresentação visual desta aula.

Ver Slides da Aula
Quiz

Teste seu entendimento básico com perguntas rápidas.

Responder Quiz
Exercícios

Prática avançada e dissertativa com consulta.

Lista de Exercícios
Projeto

Laboratório prático de codificação em C/C++.

Mini Projeto

Avançar para Aula 06

Aula 06 - Cache e Localidade

Se a Cache L1/L2 é tão crítica, como o Hardware adivinha o que o programador vai pedir? A CPU não lê bytes individuais da RAM; ela traz "blocos" contíguos chamados de Cache Lines (geralmente de 64 bytes).

✅ 1. Cache Hit e Cache Miss

O desempenho do seu loop for() depende maciçamente da Cache Hit Rate.

Cache Hit: Acerto! A CPU pediu a posição [1], ela já estava na Cache e a conta foi resolvida quase imediatamente.
Cache Miss: Erro! O processador precisou parar o Pipeline, ir até a RAM lenta, injetar o bloco de bytes na lenta escalada D-Cache/L3/L2/L1 e prosseguir.

sequenceDiagram
    participant P as Programador
    participant C as Cache L1
    participant R as RAM

    P->>C: Quero array[0]!
    Note right of C: "Cache Hit" (Sucesso imediato)

    P->>C: Quero NodeLink->prox!
    Note right of C: Não está aqui...
    C->>R: Buscar Posição Lenta na RAM...
    R-->>C: Traz o bloco de 64bytes inteiro
    Note right of C: "Cache Miss" (Atraso)

🗺️ 2. Localidade Espacial vs Temporal

As duas premissas arquiteturais da Localidade em Sistemas de Computação (que fundamentam toda escrita C/C++ otimizada):

Localidade EspacialLocalidade Temporal

Se o programa acessou a variável na posição de memória X, há extrema probabilidade de que no ciclo de CPU seguinte ele acesse a variável de memória X + 1. O clássico caso dos Arrays Continuos (std::vector), garantindo varredura limpa em Hit sequencial absoluto de 64 em 64 bytes.

Se o programa visitou a variável Y agora, há enorme probabilidade dele visitá-la nos próximos ms. O clássico caso das Variáveis Locais e Contadores Padrões (int i = 0) retidos brutalmente no Registrador ou na L1.

[!WARNING] O vilão máximo da performance: Iterar sobre matrizes pela Coluna ao invés da Linha. A imagem matriz na RAM C/C++ (Row-major order) exige saltos. E False Sharing ocorre quando threads isoladas atualizam variáveis contíguas da mesma linha de Cache de 64 bytes, forçando o Hardware (Cache Coherence Protocol) a invalidar repetitivas vezes L1/L2, triturando toda métrica.

A estrutura define a localidade espacial. Prefira dezenas de minúsculas variáveis sequenciais nos métodos a usar longos grafos com saltos randômicos baseados em ponteiros, se for iterar a esmo.

🎯 Próximos Passos

Acessar Slides

Reveja a apresentação visual desta aula.

Ver Slides da Aula
Quiz

Teste seu entendimento básico com perguntas rápidas.

Responder Quiz
Exercícios

Prática avançada e dissertativa com consulta.

Lista de Exercícios
Projeto

Laboratório prático de codificação em C/C++.

Mini Projeto

Avançar para Aula 07

Aula 07 - Stack vs Heap

Agora mergulhamos no coração cirúrgico da engenharia C/C++: "Onde o S.O. decide alocar e liberar a sua variável física real na memória?". Essa escolha define vida, morte e performance do algoritmo em tempo real.

🧱 1. A Pilha (Stack)

A Stack é a fundação natural de blocos de toda variável ordinariamente declarada dentro do escopo de funções em C/C++ (int x, float y). Ela trabalha rigorosamente sob o conceito LIFO (Last In, First Out).

Vantagens C/C++ da Pilha

Performance Imediata: Não sofre do atraso monumental do Sistema Operacional rodando scripts para achar buracos vazios. A CPU avança 1 pino de hardware no SP (Stack Pointer) e empilha na RAM. Retirou, ele decrementa. Super rápido.
Anti-Vazamento Automático: Funções extintas são imediatamente retiradas (popped) num clique atômico LIFO e as fatias voltam a uso global. Memória protegida contra vazamentos lógicos (memory leaks) por definição estrita.
Quente da CPU: Frequentemente preza por Cache Hit. A Stack costuma viver majoritariamente no limiar da L1 Data Cache.

[!CAUTION] Stack Overflow! A Pilha nunca é infinita, sendo tipicamente restrita pelo S.O. Windows/Linux (geralmente entre 1MB a 8MB max num Kernel Padrão X86). Tentar criar um int array[9999999] puro no escopo sem alocação dinâmica explodirá a Pilha e esmagará cruelmente (o temido Segmentation Fault (core dumped)).

📦 2. O Monte (Heap)

Enquanto a Pilha é rígida, restrita e pré-delimitada, o Monte (Heap) é um vasto oceano caótico de Gigabytes gerenciado pelo Kernel do S.O. (Sistemas Operacionais). Você requer pedaços de memória "sob demanda" (Alocação Dinâmica).

# Como você interage em baixo nível (C/C++)cat code.c#include <stdlib.h>

int main() {
// malloc vai no Sistema Operacional e chora pedindo: "Me dê 10 inteiros!"
int* array_gigante_dinamico = (int*)malloc(10 * sizeof(int));

// Se você não limpar usando free(), a RAM apodrecerá lentamente (LEAK)
free(array_gigante_dinamico);
}

Diferenciais do C/C++

Você é o único árbitro. Diferente de Java, Python ou C# que usam complexos robôs vasculhadores ocultos (Garbage Collectors) na sombra consumindo até 20% do processador para auditar seu Heap e limpar os lixos. O Rust automatiza e barra alocações indevidas usando Ownership sem o robozinho. O C++ fornece ferramentas novas e maduras (std::unique_ptr ou std::shared_ptr) baseadas na contagem de referência.

💀 3. Memory Leaks (Vazamentos de Memória)

Um clássico e letal bug de engenharia C++. Quando o desenvolvedor executa new ou malloc solicitando memória do Heap, mas quebra regras do fluxo perdendo o contato formal do ponteiro retornado do hardware sem antes ter reportado o fim via delete ou free. Resultado? Aquela fatia na RAM física do servidor Linux ficará congelada, cega, retida unicamente pro seu app até que a nuvem AWS exaure toda a máquina do container num erro de Kernel OOM Killer (Out Of Memory).

Em contra-partida: Dangling Pointers. Usar a área que o ponteiro apontava depois da libertação formal do free provoca instabilidade instantânea e corrupção silenciosa nos endereços da placa-mãe.

🚀 Resumo Prático

Se não sabe onde colocar: Bote no STACK.
É muito grande pra caber (Strings longas ou Arrays): Invoque HEAP com o std::vector (ele gerencia o malloc e free na destruição de escopo).

🎯 Próximos Passos

Acessar Slides

Reveja a apresentação visual desta aula.

Ver Slides da Aula
Quiz

Teste seu entendimento básico com perguntas rápidas.

Responder Quiz
Exercícios

Prática avançada e dissertativa com consulta.

Lista de Exercícios
Projeto

Laboratório prático de codificação em C/C++.

Mini Projeto

Avançar para Aula 08

Aula 08 - Memória Virtual

Se você pedir ao seu S.O. no Task Manager por quantos Gigabytes os aplicativos rodam, verá que a soma ultrapassa facilmente a capacidade real física do pente de RAM DDR inserido na placa mãe. Como isso é magicamente contido?

🕳️ 1. O Abismo Lógico: A Memória Virtual

Nenhum aplicativo C/C++ ou interpretador em execução roda interagindo fisicamente e sabendo explicitamente qual é o transistor fixo lá no pente da Kingston RAM na placa do data-center.

Todo processo que o Linux constrói roda dentro de uma gigante Ilusão. O endereço do seu ponteiro 0x7ffeeB... em C++ é falso (Endereço Lógico).

O HW (Hardware MMU no processador) mais as planilhas do Sistema Operacional (Page Tables) formencem a ligação dinâmica e escondida pra sua aplicação.

graph LR
    A["Ponteiro em C++<br/>(Virtual 0x01)"] --> B{"MMU e<br/>Page Table"}
    B --> C("Memória RAM<br/>(Física Pente 1)")
    B -. "Se não houver espaço" .-> D("Swap / Pagefile<br/>(SSD)")

A Memória Virtual (VM) é um sanduíche mental e isolador protetor usado pelo S.O. Ela entrega para o ponteiro do processo o pretexto visual de que ele tem toda a memória que ele quiser num universo contínuo livre.

📄 2. TLB, MMU e a Tradução da Página

Cada tradução do falso ponteiro visual com base nas tabelas em RAM é custoso (Cycle Penalty).

Para driblar isso, a arquitetura moderna usa a TLB (Translation Lookaside Buffer). A TLB é uma Cache dentro da CPU que guarda apenas os dicionários recentes das planilhas de referências que dizem se o "0X7FFA falso vira bloco 344 do pente de DDR5 real".

Page Hit e Page Fault

Page Hit: A tradução ocorreu instatâneamente pela cache veloz na CPU (a TLB validou o ponteiro do C++ localizando logo onde está no metal a variável no chip Kingston).
Page Fault Limitrofico: A TLB errou e teve que rolar pra Main RAM puxando o endereço mapeado localizando num novo cluster na pilha. (100+ ciclos)
Page Fault Crítico (SWAP): A máquina não acha e entra em Swapping com o SSD (SSD Swap). É ali que ocorre as quedas colossais para "Travamento de Janela", a CPU foi pro SSD buscar um arquivo gigante que o Linux ejetou lá, pra trazer e rebotar pra cima pra Memória RAM física real, jogando pro seu código que achava estar "na memória" e dormiu (Milhões de ciclos).

💪 3. Driblando a Paginação como Programador

Ao iterarmos matrizes massivas (Matrizes 2D em C++) na ordem invertida ou em lógicas dispersas LinkedList->prox, você não causa apenas Cache Miss da Aula 06. Você também destrói toda a cache de pontes TLB Misses! Você induzirá Page Faults insanos que derrubarão o throughput (taxa de transferência de dados) em N fatores.

Portanto: Localidade Espacial é sagrada em Dados C/C++.

🚀 Resumo Prático

O ponteiro que o dev manipula com um int *ptr = &value em qualquer IDE é puramente 100% Virtual. É o passaporte intermediário.
Nunca dependa da paginação e arquivo local de Swap do Disco: os milésimos de segundo viram minutos na Nuvem se o app "estourar a cota da cloud", sofrendo Thrashing com o Disco local para falsificar a RAM que ele acreditou ter num loop mal codificado ou em Leaks do Módulo/Aula anterior.

🎯 Próximos Passos

Acessar Slides

Reveja a apresentação visual desta aula.

Ver Slides da Aula
Quiz

Teste seu entendimento básico com perguntas rápidas.

Responder Quiz
Exercícios

Prática avançada e dissertativa com consulta.

Lista de Exercícios
Projeto

Laboratório prático de codificação em C/C++.

Mini Projeto

Avançar para Aula 09

Módulo 3 – Concorrência e Paralelismo

Aula 09 - Processos e Threads

É vital dominar como espalhar execuções concorrentes na topologia de múltiplos núcleos nos processadores de hoje. Caso contrário, um computador com 32 cores rodará seu backend Python (que possui GIL) de altíssima latência amargando 31 núcleos ociosos gastando energia.

🏃 1. Processos (Isolamento Forte)

O Processo é o contêiner mestre do Sistema Operacional. Quando a execução do seu binário em C/C++ se inicia via Terminal, vira um Processo (PID 2900).

O S.O. dá ao Processo sua própria e exclusiva Memória Virtual (visto na Aula 8).
O Processo tem sua exclusiva Pilha e não se mistura nunca. E isso isola falhas: se um Chrome (processo isolado) trava, não dá tela azul na outra aba.
A comunicação entre Processos (IPC - Inter-process Communication) é pesada e necessita do S.O. através de Pipes ou Redes.

🧵 2. Threads (Isolamento Fraco / Partilha)

Quando se está em um jogo e, ao mesmo tempo que carrega os gráficos na GPU, uma música de CD está lendo sem travar, estamos olhando para Multithreading!

graph TD
    A("Processo (ID: 5599) - Backend Web") --> B[("Heap Memory (Compartilhado)")]
    A --> C["Thread 01 (Rota A)"]
    A --> D["Thread 02 (Rota B)"]
    A --> E["Thread 03 (Pool C)"]

    C --> F((Stack Exclusiva T1))
    D --> G((Stack Exclusiva T2))
    E --> H((Stack Exclusiva T3))

    B --> C
    B --> D
    B --> E

Uma Thread é simplesmente uma subdivisão leve controlada do processo. Elas todas orbitam e vivem na exata MESMA MEMÓRIA VIRTUAL (Heap) DO PROCESSO MESTRE.

BenefícioCatástrofe

Duas std::thread manipulando os ponteiros apontam rigorosamente rápido ao mesmo endereço na RAM sem nenhuma barreira do S.O., o que traz milisegundos imbatíveis versus IPC!

Como ambas alteram ativamente a mesmíssima RAM viva desprotegidas, se elas lerem/sobreescreverem juntas o mesmo byte int da Conta Bancária C++, ocorre o letífero e maldoso Data Race (Condição de Corrida de Dados).

⚙️ 3. Context Switch (A Faca de Dois Gumes)

Quando escrevemos "Hello World", achamos que a CPU roda por horas sem interrupções. Engano.

O S.O. possui um núcleo (Kernel Scheduler) que fatia milésimos de milésimos de segundos distribuindo uma core i7-P para a aba do Google, logo retira o Google e taca nos frames do VS-Code, em micro-loop alternante de Context Switches. O problema? Puxar e devolver o estado (registradores, program counter) na cache é hiper custoso e derruba o Pipeline se abusado (overhead em CPU bound apps).

🚀 Resumo Prático

Se a tarefa for CPU-Bound (requerer Matemática Bruta Massiva / Machine Learning), você cria Threads numerando-as próximo número oficial de núcleos estritos da CPU, evitando desperdício de overhead com Context Switches ilusórios.
É muito fácil em C/C++ estragar a vida financeira do cliente numa Race Condition compartilhada pelo Heap se não protegida... mas isso é o tema da próxima aula!

🎯 Próximos Passos

Acessar Slides

Reveja a apresentação visual desta aula.

Ver Slides da Aula
Quiz

Teste seu entendimento básico com perguntas rápidas.

Responder Quiz
Exercícios

Prática avançada e dissertativa com consulta.

Lista de Exercícios
Projeto

Laboratório prático de codificação em C/C++.

Mini Projeto

Avançar para Aula 10

Aula 10 - Sincronização e Concorrência

Como abordado na Aula 09, a vantagem da extrema performance das Threads nativas possuírem acesso irrestrito e descontrolado à mesma Memória do processo C++ pode culminar na tragédia iminente conhecida como de Condição de Corrida (Race Condition).

🏎️ 1. O Data Race: Uma Colisão Inevitável

Imaginemos uma variável primitiva int balance = 100;. Em Assembly C/C++, aumentar uma quantia em balance += 10; não é "Um Único Movimento". O HW (Processador) traduz internamente num RMW: Read (Puxa os 100 da RAM para o Registrador EAX), Modify (Adiciona +10 e vira 110 na ALU), e Write (Substitui na RAM os antigos 100 por 110).

Se na fresta entre a Thread 1 preencher o EAX e depois descer ao RAM o valor 110... a Thread 2 rodar e "puxar os mesmíssimos originais 100" para outro registrador (Context Switch), quando abas enviarem pra RAM final as sobreposições as contas, um dos 10 desvanecerá, o banco perde e a variável fica logicamente corrompida.

🛡️ 2. Mutex e The Critical Section

A solução em qualquer projeto multi-thread backend/C++ é envolver as memórias ou o fluxo com objetos pesados atômicos do Kernel: As Locks (Travas) como padrão Ouro C++: std::mutex (Mutual Exclusion).

# Em C++, protege-se a variável central assim:cat bank.cppstd::mutex portaCorredor;

void adiciona_10() {
portaCorredor.lock(); // O Hardware garante atomicamente exclusão
balance += 10; // Apenas UM transita aqui adentro.
portaCorredor.unlock(); // O primeiro sai da sala, e notifica o Kernel
}

A área demarcada pelo lock a unlock é intitulada Seção Crítica. O poder e o problema do design residem aí: Se você for preguiçoso e prender 10.000 linhas da sua transação atrás da Seção Crítica Mestre, o teu glorioso Processador Multicore Ultra de 32 cores se comportará como um ridículo e solitário Processador Antigo Pentium de 1 core single Threaded, derrubando teu design ao zero! Tudo vai rodar Enfileirado (Serializado). O bom C++ trava com extrema granuladidade e rapidíssimo na variável.

🚦 3. O Dilema: Deadlock

Mas e se o programador de Backend C/C++ prender (usou lock() ou Mutex) em A esperando que B seja terminado.. mas B só termina porque B precisa pegar lock() em A que tá bloqueado?

Ambos processos morrem na tela, dormindo inertes (Blocked State), enquanto a barra de % CPU despenca lentamente para ZERO! Seu Sistema Paralelo entrou em Deadlock. (O Abraço Mortal Padrão The Dining Philosophers). Um design multi-thread exige uma heuristica sagrada de adquirir as trancas Lock C++ em idêntica e constante ordem arquitetural através dos sistemas, ou apelar a mecânicas std::lock() que aplicam garantias subjacentes do Kernel.

🚀 Resumo Prático

Mutex: Usa o sistema do núcleo para trancar áreas exclusivas do Hardware (RAM).
Se a concorrência não tiver "Seção Crítica" que lida com Gravação e tiver "Só Read-only", não aplique trancas (Mutex) para não serializar as Threads da máquina.

🎯 Próximos Passos

Acessar Slides

Reveja a apresentação visual desta aula.

Ver Slides da Aula
Quiz

Teste seu entendimento básico com perguntas rápidas.

Responder Quiz
Exercícios

Prática avançada e dissertativa com consulta.

Lista de Exercícios
Projeto

Laboratório prático de codificação em C/C++.

Mini Projeto

Avançar para Aula 11

Aula 11 - Paralelismo no Hardware

O código Multithreading (visto na Aula 09 e 10) é uma abstração do Sistema Operacional. Mas como a física do processador de fato abraça múltiplas frentes de execução simétrica simultânea?

🏗️ 1. Multi-Core (Múltiplos Núcleos)

Diferente do passado, onde havia um único núcleo saltando entre aplicativos (Context Switch), hoje temos vários núcleos físicos no mesmo invólucro (Chip).

Core Físico: É uma CPU completa e independente, com sua própria ALU, Unidade de Controle e Caches L1/L2 particulares.
Cache L3 Compartilhado: Na maioria dos designs AMD e Intel reais, os Múltiplos Cores (Ex: 8 Cores) conversam e trocam estados através de uma suntuosa e lenta área comum L3 que circunda todos os processadores ali impressos no wafer.

[!TIP] Em Backend pesado: Se o banco mapear duas Threads puras backend em dois Cores puramente isolados (Ex: Core 0 e Core 1), e elas lerem/trabalharem na mesma matriz contínua, o Hardware forçará intercâmbios elétricos no Cache Coherence Protocol (MESI) rodando por toda placa mãe. Fiquem espertos com o False Sharing!

🧬 2. Hyper-Threading (SMT - Symmetrical Multi-Threading)

A mágica comercial da Intel e AMD nos anos 2000. Como fazer "1 Core Físico" fingir ser "2 Cores Lógicos" para o Windows/Linux?

Na aula 03, vimos que a execução cruza pelo Pipeline ou pode esbarrar em ciclos ociosos na CU aguardando a Memória Principal. O Hyper-Threading espeta um Segundo conjunto de Registradores e Hardware de Estado no mesmo Core. Enquanto o código da Thread "A" está 0.5 nanosegundo travada esperando chegar o dado lento da L3, o Core troca instantaneamente para o contexto da Thread "B", executando-o usando as mesmas Unidades Lógicas (ALU) num aproveitamento fabril monstruoso de 100%.

# Lendo o processador em Linux (Ex: i7 4-Core com HyperThreading)lscpuCPU(s): 8
On-line CPU(s) list: 0-7
Thread(s) per core: 2
Core(s) per socket: 4

Vemos 8 CPUs acima, mas fisicamente a máquina tem 4 motores reais.

🎮 3. GPUs: O Paralelismo Maciço

CPUs (Processadores) foram feitos para "Serem Rápidos executando sequências lógicas e IFs complexos". Possuem Caches gigantes. GPUs (Placas de Vídeo) foram feitas para "Executar a MESMÍSSIMA MINÚSCULA matemática simultaneamente em milhares de pixels fracos". Sem grandes condicionais, focando no Throughput.

NVIDIA e CUDA (plataforma de C++) reinam supremas em Deep Learning e Criptografia exatamente porque pegam Loops For gigantescos de Álgebra Linear, e fracionam em 8.000 mini-núcleos (CUDA cores) esmagando qualquer Intel Core i9 na latência matemática contínua pura.

🚀 Resumo Prático

Task Paralelism: Se tens lógica variada, use a CPU Multi-Core C++ thread pool.
Data Paralelism: Se a conta for a repetição retumbante de um algoritmo idêntico sobre 2 milhões de dados sem dependência de saltos complexos, mova-a da RAM à VRAM da GPU via CUDA/OpenCL. A métrica vai das horas paras os décimos de segundo.

🎯 Próximos Passos

Acessar Slides

Reveja a apresentação visual desta aula.

Ver Slides da Aula
Quiz

Teste seu entendimento básico com perguntas rápidas.

Responder Quiz
Exercícios

Prática avançada e dissertativa com consulta.

Lista de Exercícios
Projeto

Laboratório prático de codificação em C/C++.

Mini Projeto

Avançar para Aula 12

Aula 12 - O Modelo de Memória

Ao nos aventurarmos com C/C++ moderno em sistemas de Alta-Concorrência, a própria sanidade da ordem do código é subvertida e o que julgávamos executar "em sequência", esfacela-se nos pipelines de CPU. Bem-vindos ao labirinto da Reordenação.

🔀 1. A Reordenação do Compilador e CPU (Out-Of-Order Execution)

Você codifica:

int x = 0;
int FLAG = false;

// Em uma Thread Secundária
x = 42;         // PASSO A
FLAG = true;    // PASSO B

Um programador esperançoso diz: "Vou ler a váriavel na Thread Oposta (Main)... e quando FLAG for true, sei que X é impreterivelmente 42 pois executei a linha acima primeiro na tela!"

FALSO! MORTALMENTE FALSO!

O Compilador C++ (GCC -O3) pode achar que o PASSO B é irrelevante para o PASSO A (não usam das mesmas métricas) e reordenar por conta própria o seu executável para gravar a FLAG e depois o 42 nas linhas do assembly.
O CISC (Intel x86) Processador Superscalar Out-Of-Order percebe que a posição de x estava fria na Cache L3, mas a variável FLAG estava quente presa na L1D. Ele salva na FLAG imediatamente (Store Buffers), adiantando a etapa 2, antes da 1, para não morrer de ócio no Pipeline. E seu código multi-thread infarta com B chegando a ser lido remotamente como TRUE com A ainda em 0 (zero)!!

🚧 2. O Memory Model (Consistências e Barreiras)

O C++11 emitiu formalmente o seu universal Memory Model definindo através da biblioteca std::atomic o que o Hardware tem permições para Adiantar vs Trancar.

Relaxed Consistensy (std::memory_order_relaxed): A CPU é dona, reordene como quiser em torno da sua vizinhança na RAM, apenas aplique na thread isolada em segurança. Performance brutal.
Release / Acquire (std::memory_order_acquire / release): O padrão para transferir fardos (como ler a Fila sem locks e sem medo da Out-Of-Order embaralhar flags finalizadoras de Loop C++ no hardware alheio do *Core 2).
Sequential Consistency (std::memory_order_seq_cst): O C++ por default invoca barreiras completas absolutas elétricas. Força todas as cores (L1/L2) da CPU e do compilador a não alterarem NADA a ordem que seu texto determinou. Seguro, mas castrador de velocidade em processadores ARM.

🧱 3. Memory Barriers (Fences) nas CPUs

Se não tivessemos essa lei std::atomic no standard oficial do GCC, programávamos via "Gambiarra Intrinseca" de Processador (Ex: Comando Assembler MFENCE ou SFENCE no Intel). Os Fences proíbem categoricamente a travessia de saltos das sub-operações em Assembly, estancando a execução como um sinaleiro fechado.

[!INFO] É por isso que programar Software Infra-estrutural de Baixo Nível (Databases, Motores de Redes Socket, SO Kernel Driver) é extremamente difícil: As reordenações da CPU nunca acontecem quando você depura linha a linha na IDE (pois a paralela não é instigada). Elas só geram corrupções bizarras randômicas 1x na vida e morrem meses na escura neblina de servidores reais operando 100 mil Requests por Minuto no DataCenter. Onde a pressão elástica exaure as Caches e expõe seus Bugs de Memory Models relaxados.

🚀 Resumo Prático

Se duas "Threads" conversam através das mesmas variáveis limpas de C e não possuam std::mutex da aula 10 as blindando, USE std::atomic<bool>. Do contrário você é uma vítima da Superscalar Out Of Order Intel Architecture Pipeline (a reordenação elétrica).

Isso enterra as nuances sombrias das memórias RAM + Cache. Agora mergulhemos no escuro do "Lento Discovoador": Os Armazenamentos (Avançar).

🎯 Próximos Passos

Acessar Slides

Reveja a apresentação visual desta aula.

Ver Slides da Aula
Quiz

Teste seu entendimento básico com perguntas rápidas.

Responder Quiz
Exercícios

Prática avançada e dissertativa com consulta.

Lista de Exercícios
Projeto

Laboratório prático de codificação em C/C++.

Mini Projeto

Avançar para Aula 13

Módulo 4 – Armazenamento e I/O

Aula 13 - Dispositivos de Armazenamento

Descendo a pirâmide de memória, deixamos a rápida (porém volátil) RAM e caímos no domínio da persistência permanente. O armazenamento é inerentemente mais lento, e sua taxonomia dita o Design do seu Banco de Dados Central.

💽 1. HDD (Hard Disk Drive) vs SSD (SATA)

HDD MagnéticoSSD (Solid State Drive SATA)

O disco de pratos giratórios com uma agulha física. Latência: O motor precisa literalmente girar (Seek Time e Latência Rotacional) até o bloco desejado. As leituras sequenciais (filmes grandes contínuos) são aceitáveis, mas Random Access (leitura randômica de pequenos arquivos) é catastrófica, beirando a eternidade computacional.

Armazenamento em chips de memória Flash (NAND). Zero partes móveis. Latência: Mil vezes superior ao HDD em acesso Randômico. Seu Banco de Dados Relacional MySQL renasce num SSD porque consegue varrer os índices disparatadamente sem esperar "O disco girar". Ele satura, porém, a banda do Barramento SATA (máx. 600 MB/s).

⚡ 2. NVMe (O Limite PCIe)

Para ultrapassar o gargalo da conexão SATA antiga, a tecnologia moveu os SSDs diretamente para injetarem dados nas pistas ultra-rápidas da placa-mãe (PCI-Express). Módulos NVMe M.2 se comunicam fisicamente por canais em que passam Gigabytes por segundo (ex: Gen4 cruza 7.000 MB/s).

Isto alterou para sempre o Backend moderno: Os Softwares de Memória In-Memory (Redis) estão repensando paradigmas pois o Disco NVMe moderno às vezes responde com velocidade que roça a velha memória RAM DDR3!

📈 3. IOPS - A Métrica Real do Servidor

Se a banda (MB/s) diz o volume da mangueira, os IOPS (Input/Output Operations Per Second) dizem quantos golpes a mangueira dá por segundo.

Quando você hospeda um App Node/Python que grava 1 milhão de pequenos logs .txt de 1KB, não importa se você tem 7000 MB/s. Você precisa de IOPS Altíssimos, para que a fila matemática de Write Requests não trave seu servidor (I/O Wait / Blocked).

[!CAUTION] Ao configurar a AWS (Amazon Cloud), instâncias EBS (Discos elásticos anexados) cobram mais caro pela volumetria de IOPS. O gargalo da sua API lenta de CRUD nunca é a CPU, geralmente é porque o Disco Estourou sua cota de Burst de IOPS.

🚀 Resumo Prático

O desenvolvedor C++ entende isso programando a I/O por grandes lotes (Buffers). Não escreva no disco 1 byte no laço for por 1 milhão de vezes (Destruição de IOPS). Acumule os dados num Buffer gigântico de 1 MB na RAM, e comande gravar os dados no SSD em único e massivo Request! (Otimização máxima de Throughput).

🎯 Próximos Passos

Acessar Slides

Reveja a apresentação visual desta aula.

Ver Slides da Aula
Quiz

Teste seu entendimento básico com perguntas rápidas.

Responder Quiz
Exercícios

Prática avançada e dissertativa com consulta.

Lista de Exercícios
Projeto

Laboratório prático de codificação em C/C++.

Mini Projeto

Avançar para Aula 14

Aula 14 - Sistemas de Arquivos

Um Hardware (SSD vazio) nada mais é que um deserto de bilhões de celulas silício aptas a guardar carga estática. Sem um Software Organizador, é indomávél. O File System (Sistema de Arquivos) é esse gerenciador fornecido pelo Sistema Operacional.

🗂️ 1. O V-Node / Inode

Se no seu PC existe a pasta Docs/foto.jpg, no fundo, o Linux não rastreia o texto "foto.jpg" para pular de cluster em cluster. O FS usa de índices numéricos ultra-rápidos: os Inodes.

graph LR
    A["Diretório /Docs"] -->|12345| B("Inode 12345")
    B --> C["Tamanho: 2MB"]
    B --> D["Permissões: rwxr-xr-x"]
    B --> E["Blocos Físicos de Dados"]
    E --> F["Cluster 80 no SSD"]
    E --> G["Cluster 89 no SSD"]

[!INFO] Por que o comando de Deletar (rm) um arquivo grande é quase instantâneo, mas copiar é lento? O rm apaga apenas a entrada no Índice (Inode), fingindo pro SO que o espaço tá livre. O dado mesmo ainda tá lá magnetizado até algo escrever por cima (Por isso existem softwares de recuperação de dados!)

🛡️ 2. Journaling (A Prova contra Quedas)

Mudar um arquivo é uma transação: Apagar o velho, escrever o novo, mudar o Inode. E se faltar luz na etapa 2? A partição corromperia inteiramente para sempre (Problema antigo do FAT32).

FSs modernos (NTFS, EXT4) usam Journaling. Antes de aplicar qualquer mudança no Inode oficial, eles "anotam a intenção do que vão fazer" num Diário Oculto (Journal). Se a luz cai, ao ligar o PC, ele lê o diário oculto incompleto, reverte o estrago e devolve sua máquina salva! É a essência do conceito Atomicidade.

🚄 3. Buffers e Page Cache (Por que Linux é Rápido)

"Escrever no disco" via SysCall C++ write() ou fwrite() raramente vai pro HD! O Linux usa de forma abusiva toda a RAM ociosa do seu computador como um gigantesco Cache File. Ele capta suas writes e diz "Gravei amigão!" mas jogou na RAM (Page Cache). Posteriormente ele realiza os envios reais para o Hardware agrupados (Flush / Sync).

Essa mágica salva a Morte do seu SSD (menos gravações simultâneas em desgaste das celulas NAND) e simula uma ilusão de lentidão zero ao usuário.

🚀 Resumo Prático

Ao usar C/C++, chame o instrínseco fsync() se seu App for um Banco de Dados ou Software Crítico Bancário forçando a Cache RAM descarregar a força e salvar permanentemente no silício do disco.
Nunca dependa da nomenclatura C: /usr/foto.jpg. Leia descritores de arquivo, file-pointers e fluxos binários se for transitar redes em baixo nível.

🎯 Próximos Passos

Acessar Slides

Reveja a apresentação visual desta aula.

Ver Slides da Aula
Quiz

Teste seu entendimento básico com perguntas rápidas.

Responder Quiz
Exercícios

Prática avançada e dissertativa com consulta.

Lista de Exercícios
Projeto

Laboratório prático de codificação em C/C++.

Mini Projeto

Avançar para Aula 15

Aula 15 - Entrada e Saída (I/O)

Se o Processador e a Memória trabalham num relógio bilionário (GHz), como eles se comunicam com o Teclado USB do seu usuário ou sua Placa de Rede cuja resposta se mede nas lentas métricas de milissegundos?

🚪 1. System Calls (O Pedágio do Kernel)

Programas nativos de C/C++ rodando na zona abstratamente segura (User Space) NÃO TÊM permissão física elétron-elétron para dar ordens ao cabo de Rede de imprimir um byte TCP. Tentar burlar isso gera um sumário e fulminante encerramento compulsório pelo Processador através do bloqueio de Anéis de Proteção.

Para acionar a Rede, o C++ precisa paralisar, invocar a sagrada System Call (Syscall, ex: write, sendto, read) que abre o portal para o S.O (Kernel Space). É o Kernel Linux quem vai orquestrar a placa C de Ethernet.

⚠️ 2. Interrupções vs Polling

Seu App em Python/C diz: "Puxe o dado que está vindo no mouse". 1. Polling (Desastroso): A CPU fica travada rodando while(mouse_is_empty) {} perguntando de nano em nanosegundo "Chegou? E agora? E Agora?". (Suga 100% da CPU por um mouse inerte). 2. Interrupts (Moderno): A CPU delega para o controlador USB rodar a escuta passiva, e a CPU volta a fechar os frames de Game. Quando o usuário clica com o dedo, o Controlador injeta um choque elétrico no pino do Processador. Interrupt request (IRQ)! A CPU congela subitamente o Game, salva o contexto, trata o clique do Mouse rapidamente, e exuma a cena do Game novamente do congelamento.

🚀 3. DMA (Memória com Acesso Direto)

Mesmo com as Interrupções ajudando a não ficar paralisado Polling... Fazer a Placa de Rede encher a placa RAM transitando Bit a Bit passando pelo miolo doloroso da CPU era impraticável em Gigabit Ethernets.

A revolução moderna chama-se Direct Memory Access (DMA). Placas de Captura, NVMe e Placas de Rede conversam Diretamente com a Memória RAM por vias de bypass.

graph BT
    A["Placa de Rede"] -- "Caminho Direto (DMA)" --> B["Memória RAM"]
    A -. "Aviso via IRQ\n(Terminei!)" .-> C["CPU"]
    C -. "Ordens Lentas" .-> B

A CPU diz: "Placa, baixe o NetFlix do Ponto P pro Q na RAM". A Placa faz todo os trabalho violento por trás. A CPU usa seu pipeline pra cálculos e matemática puros, enquanto sua memória vai sendo injetada pela placa de vídeo via túneis secretos pelas pontes.

🚀 Resumo Prático

Se a sua aplicação Web Framework assíncrona (como NodeJS ou Nginx C++) trava muito com "I/O", isso significa que o Sistema delega operações custosas pelo DMA ao Kernel, enquanto orquestra Event-Loops aguardando os famigerados Interrupts de retorno.

Fim do estudo base teórico, chegamos ao final. É hora de compilar conhecimento na Otimização Pura (Aula Final).

🎯 Próximos Passos

Acessar Slides

Reveja a apresentação visual desta aula.

Ver Slides da Aula
Quiz

Teste seu entendimento básico com perguntas rápidas.

Responder Quiz
Exercícios

Prática avançada e dissertativa com consulta.

Lista de Exercícios
Projeto

Laboratório prático de codificação em C/C++.

Mini Projeto

Avançar para Aula 16

Módulo 5 – Integração Prática

Aula 16 - Projeto Final: Otimização Baseada em Hardware

A teoria desacompanhada de medições empíricas se torna pura retórica. A maturidade no universo Hardware/Software Interface em C/C++ ocorre ao expormos nosso código compilado aos utilitários pesados de medição (Profiling).

⏱️ 1. Profiling Clássico (A Vida Real)

Adivinhar onde o código está lento é a armadilha suprema do júnior. Usamos ferramentas robustas para que a Arquitetura Linux diga-nos onde os gargalos fervem a CPU.

gprof: O padrão antigo C++. Ele recompila injetando marcações contábeis nas idas e vindas de funções, revelando "Quais chamadas consumiram O Tempo Global".
Valgrind (Callgrind / Cachegrind): Ferramenta extrema rodando seu executável numa sandbox virtual que mapeia cada instrução assembly. Traz gráficos massivos de onde Ocorreram os Caches Misses da Memória L1 de nossa Aula 06!
Perf: O utilitário nativo dos programadores Linux Kernel, extraindo informações métricas em Eventos de Desvio (Branch Mispired da Aula 03) usando relógios internos dos registradores ocultos PMU do seu próprio Processador em tempo real, sem overhead sintético.

🔬 2. O Grande Desafio (Mini-Projeto Prático)

O curso desafia todo programador C/C++ a desenvolver a Prova de Fogo do Hardware:

# Desafio do Iterador de Matriz Contínuag++ matriz_opt.cpp -O3 -o matriz./matriz Iteração Horizontal (Hit L1): Tempo 140ms
Iteração Vertical (Miss L1): Tempo 2100ms

Requisitos do Projeto: 1. Alocar um Array gigantesco Massivo no Heap Dinâmico via malloc() C (Não use vectors prontos para sentir a dor no braço). 2. Criar duas lógicas for(). 3. A primeira varre a matriz na exata sequencia algébrica Row-Major. Explorando a TLB/Localidade da Aula 08 e 06. 4. O segundo For varre as colunas saltando a intervalos gigantescos. Omissões grotescas de Cache Miss. 5. Invoquem o std::chrono em volta das funções, meçam os Mils e relatem num documento Markdown o porquê de um Software ser 10 vezes mais rápido que o outro mesmo usando "a cópia mental perfeitamente idêntica das mesmíssimas operações de if e soma na ALU".

🏆 3. Conclusão da Trilha

Você navegou nas extremas profundezas da arquitetura da Computação Modernizada. Um engenheiro de Backend jamais olhará para int x; ou for() sem recordar os impactos térmicos, cache hits mortais de linha, L1 local, reordenações do std::atomic Memory Model ou Page Faults nos clusters de Sistema e Processos em Swap.

Parabéns pela resiliência no vale do Silício e da Matemática discreta profunda. Nunca pare de medir e Otimizar. O Hardware dita as leis; o Software obedece.

Finalizar e Visitar Projetos

🎯 Próximos Passos

Acessar Slides

Reveja a apresentação visual desta aula.

Ver Slides da Aula
Quiz

Teste seu entendimento básico com perguntas rápidas.

Responder Quiz
Exercícios

Prática avançada e dissertativa com consulta.

Lista de Exercícios
Projeto

Laboratório prático de codificação em C/C++.

Mini Projeto

Materiais

Bem-vindo à seção de materiais complementares do curso. Aqui você encontra recursos adicionais para apoiar seus estudos.

Slides
- Acesse os slides de todas as aulas para revisão.
Exercícios
- Pratique com listas de exercícios para cada módulo.
Quizzes
- Teste seus conhecimentos com quizzes interativos.
Projetos
- Desenvolva projetos práticos para aplicar o que aprendeu.
Setup
- Guias de instalação e configuração do ambiente.

Slides

Slides Interativos

Nesta seção você acessa os slides completos de cada uma das 16 aulas do Curso. As apresentações foram desenhadas com visual otimizado Reveal.js.

Para utilizar as transições (como as setas do teclado) em tela-cheia, pressione a tecla F.

Módulo 1 – Fundamentos de Arquitetura de Computadores

Aula 01 - Como o Software Roda no Hardware
Aula 02 - Representação de Dados
Aula 03 - CPU: Estrutura e Funcionamento
Aula 04 - Arquiteturas RISC vs CISC

Módulo 3 – Concorrência e Paralelismo

Aula 09 - Processos e Threads
Aula 10 - Sincronização e Concorrência
Aula 11 - Paralelismo no Hardware
Aula 12 - O Modelo de Memória

Módulo 4 – Armazenamento, I/O e Prática

Aula 13 - Dispositivos de Armazenamento
Aula 14 - Sistemas de Arquivos
Aula 15 - Entrada e Saída (I/O)
Aula 16 - Projeto Final: Otimização Baseada em Hardware

Exercícios

Listas de Exercícios Práticos

Cada sessão de atividades progressivas envolve as dinâmicas mais comuns em arquitetura de baixo nível C/C++.

Módulo 1 – Fundamentos de Arquitetura de Computadores

Prática 01 - Como o Software Roda no Hardware
Prática 02 - Representação de Dados
Prática 03 - CPU: Estrutura e Funcionamento
Prática 04 - Arquiteturas RISC vs CISC

Módulo 2 – Memória e Performance

Prática 05 - Hierarquia de Memória
Prática 06 - Cache e Localidade
Prática 07 - Stack vs Heap
Prática 08 - Memória Virtual

Módulo 3 – Concorrência e Paralelismo

Prática 09 - Processos e Threads
Prática 10 - Sincronização e Concorrência
Prática 11 - Paralelismo no Hardware
Prática 12 - O Modelo de Memória

Módulo 4 – Armazenamento, I/O e Prática

Prática 13 - Dispositivos de Armazenamento
Prática 14 - Sistemas de Arquivos
Prática 15 - Entrada e Saída (I/O)
Prática 16 - Projeto Final: Otimização Baseada em Hardware

Quizzes

Quizzes Interativos

Teste os seus conhecimentos adquiridos durantes as explorações teóricas.

Módulo 1 – Fundamentos de Arquitetura de Computadores

Quiz 01 - Como o Software Roda no Hardware
Quiz 02 - Representação de Dados
Quiz 03 - CPU: Estrutura e Funcionamento
Quiz 04 - Arquiteturas RISC vs CISC

Módulo 2 – Memória e Performance

Quiz 05 - Hierarquia de Memória
Quiz 06 - Cache e Localidade
Quiz 07 - Stack vs Heap
Quiz 08 - Memória Virtual

Módulo 3 – Concorrência e Paralelismo

Quiz 09 - Processos e Threads
Quiz 10 - Sincronização e Concorrência
Quiz 11 - Paralelismo no Hardware
Quiz 12 - O Modelo de Memória

Módulo 4 – Armazenamento, I/O e Prática

Quiz 13 - Dispositivos de Armazenamento
Quiz 14 - Sistemas de Arquivos
Quiz 15 - Entrada e Saída (I/O)
Quiz 16 - Projeto Final: Otimização Baseada em Hardware

Projetos

Laboratórios de Projetos

Coloque em prática seu aprendizado de Hardware implementando ferramentas reais com C/C++.

Módulo 1 – Fundamentos de Arquitetura de Computadores

Lab 01 - Como o Software Roda no Hardware
Lab 02 - Representação de Dados
Lab 03 - CPU: Estrutura e Funcionamento
Lab 04 - Arquiteturas RISC vs CISC

Módulo 2 – Memória e Performance

Lab 05 - Hierarquia de Memória
Lab 06 - Cache e Localidade
Lab 07 - Stack vs Heap
Lab 08 - Memória Virtual

Módulo 3 – Concorrência e Paralelismo

Lab 09 - Processos e Threads
Lab 10 - Sincronização e Concorrência
Lab 11 - Paralelismo no Hardware
Lab 12 - O Modelo de Memória

Módulo 4 – Armazenamento, I/O e Prática

Lab 13 - Dispositivos de Armazenamento
Lab 14 - Sistemas de Arquivos
Lab 15 - Entrada e Saída (I/O)
Lab 16 - Projeto Final: Otimização Baseada em Hardware

Configuração

Configuração do Ambiente

Bem-vindo à seção de configuração! Prepare seu ambiente para acompanhar as aulas de Hardware para Programadores focando na linguagem C e C++.

Configuração no Windows
- Setup C/C++ (MSYS2)
- Download dos Compiladores GCC/G++ em ambiente MSYS2
- Instalação e Extensões no Visual Studio Code (C/C++ e Code Runner)
Configuração no Linux
- Setup C/C++ (build-essential)
- Configurações com Aptitude usando pacotes base build-essential e gdb
- Adicionando de forma nativa no VS Code
Configuração no macOS
- Setup C/C++ (Apple Clang)
- Ferramentas Command Line Tools do Xcode e terminal UNIX
- Gerenciamento com Homebrew e VS Code

📋 Próximos Passos

Após configurar seu ambiente:

✅ Comprove o Compilador: Teste a saída de comando do g++ --version ou gcc --version.
📚 Instale as extensões obrigatórias: Adicione as bibliotecas do C/C++ da Microsoft em sua IDE conforme listado nos setups.
🚀 Comece a aventura: Mergulhe na Aula 01

Configuração do Ambiente (macOS)

O macOS, devido à sua fundação UNIX (semelhante ao Linux), possui um ecossistema excelente e orgânico para desenvolvedores C/C++. No entanto, em vez do compilador livre GNU (gcc), a Apple dita e preza pelo uso de seu próprio compilador proprietário otimizado e veloz: o Clang (baseado em LLVM).

Neste manual, prepararemos seu Mac (seja arquitetura Intel, ou modernas frentes Apple Silicon M1/M2/M3) para compilar e rodar os nossos códigos ao longo de toda a matéria.

🛠️ 1. O Compilador Nativo (Apple Clang)

A Apple fornece todas as ferramentas fundamentais agrupadas num pacote oficial chamado "Command Line Tools do Xcode". Não é necessário baixar a IDE pesadíssima do Xcode inteira, bastam as ferramentas de terminal.

Abra o aplicativo nativo Terminal (ou seu de preferência como iTerm2) e insira o seguinte gatilho no prompt:

$ xcode-select --install

[!INFO] Uma janela em popup gráfico surgirá no seu OS perguntando se você deseja instalar as Ferramentas de Linha de Comando. Aceite e aguarde o download (costuma ter alguns GBs de depêndencias essenciais, como make, clang e as livrarias standard do C).

Confirmando a Instalação

Após o término, para testar se a âncora do hardware já tem consciência do seu compilador C++, no próprio terminal, digite:

clang++ --version

Se um bloco de texto contendo Apple clang version... surgir, a fundação está sólida!

🍺 2. Homebrew (Opcional, mas Altamente Recomendado)

Diferente do Linux que usa apt, a forma mais civilizada de gerenciar pacotes binários e softwares no Mac é através do Homebrew. Ele é a salvação do leão de chácara em C/C++ frente a biblitecas adicionais de terceiros.

Caso ainda não possua, copie do site oficial brew.sh o comando para colar no seu terminal:

/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"

(Leia as instruções pós-instalação no terminal caso seja um Mac M1/M2/M3 ARM, ele pedirá para adicionar o brew ao $PATH no seu ~/.zprofile)

💻 3. O Editor de Código (Visual Studio Code)

Use seu recém-instalado poder do Brew para baixar limpidamente a nossa IDE do curso:

brew install --cask visual-studio-code

Ou alternativamente, baixe via .dmg no site code.visualstudio.com.

Extensões Obrigatórias no VS Code

Abra o seu VS Code recém instalado, procure pela aba quadrada de Extensions e pesquise:

C/C++ (fabricante oficial: Microsoft): Traz sintaxe, debug visual na IDE (usando LLVM/lldb nativo do Mac) e autocompletar do código base (IntelliSense).
Code Runner (fabricante oficial: Jun Han): Instala um ícone de "Play" (▶️) super conveniente no topo direito da janela, permitindo compilar e enviar saída rodando do app num instante.

🎉 A Magia UNIX Pronta! Seu sistema macOS agora está perfeitamente alinhado em linha de comando UNIX e compilará códigos C/C++ na velocidade espetacular dos processadores da Apple sem interrupções.

Versão para Impressão

Esta página foi gerada automaticamente para impressão.

Informações

🎓 Curso: Hardware para Programadores (C/C++)

⚡ Atalhos Rápidos

🗺️ Mapa da Jornada (Módulos)

📦 Módulo 1: Fundamentos de Arquitetura de Computadores

📐 Módulo 2: Memória e Performance

🧠 Módulo 3: Concorrência e Paralelismo

💻 Módulo 4: Armazenamento, I/O e Prática

💡 Dicas de Sucesso

Sobre o Curso

🎓 Hardware para Programadores - A Ponte Entre Silício e Software

🎯 Objetivos do Curso

📚 O Que Você Vai Aprender

MÓDULO 1 – Fundamentos de Arquitetura de Computadores

MÓDULO 2 – Memória e Performance

MÓDULO 3 – Concorrência e Paralelismo

MÓDULO 4 – Armazenamento e I/O

MÓDULO 5 – Integração Prática

🛠️ Metodologia

👨‍🎓 Para Quem é Este Curso

📋 Pré-requisitos

🎖️ O Que Você Receberá

🚀 Comece Agora

Plano de Ensino: Hardware para Programadores (C/C++)

1. Identificação

2. Ementa

3. Objetivos

Objetivo Geral

Objetivos Específicos

4. Conteúdo Programático

5. Metodologia

6. Avaliação

7. Bibliografia Recomendada

Aulas

Aulas do Curso

📚 Módulos do Curso

Módulo 1 – Fundamentos de Arquitetura de Computadores

Aula 01 - Como o Software Roda no Hardware

🏗️ 1. O Abismo entre Código e Silício

O Processo de Compilação (C/C++)

🛠️ 2. Compiladores vs Interpretadores

📐 3. ISA: O Contrato do Processador

🚀 Resumo Prático

🎯 Próximos Passos

Aula 02 - Representação de Dados

🔢 1. Sistema Binário e Hexadecimal

🔋 2. Inteiros com e sem Sinal (Unsigned)

🧮 3. Ponto Flutuante (IEEE 754)

O Perigo da Precisão!

🚀 Resumo Prático

🎯 Próximos Passos

Aula 03 - CPU: Estrutura e Funcionamento

🏗️ 1. O Triângulo de Ouro: ALU, CU e Registradores

🔄 2. O Ciclo de Instrução (Fetch-Decode-Execute)

⚡ 3. Pipeline e Previsão de Desvio (Branch Prediction)

O perigo do "IF"

🚀 Resumo Prático

🎯 Próximos Passos

Aula 04 - Arquiteturas RISC vs CISC

🥊 1. Entendendo a Batalha

🖨️ 2. Como isso afeta o Compilador C/C++?

🚀 Resumo Prático

🎯 Próximos Passos

Módulo 2 – Memória e Performance

Aula 05 - Hierarquia de Memória

🏛️ 1. A Pirâmide de Alta Performance

⏳ 2. Os Impactos da Latência (Lado do Código)

🎯 3. Optimizando Uso

🚀 Resumo Prático

🎯 Próximos Passos

Aula 06 - Cache e Localidade

✅ 1. Cache Hit e Cache Miss

🗺️ 2. Localidade Espacial vs Temporal

🧨 3. False Sharing e Lógica Invertida (A Morte do C++)

🎯 Próximos Passos

Aula 07 - Stack vs Heap

🧱 1. A Pilha (Stack)

📦 2. O Monte (Heap)

💀 3. Memory Leaks (Vazamentos de Memória)

🚀 Resumo Prático