O Código Morse Digital?
Formatos de Texto: o Código Morse digital?
E ai galera! Continuando a série sobre as diferenças dos principais FORMATOS DE ARQUIVOS. Para você que caiu do nada neste artigo e não tem ideia do que estou falando, clique aqui e veja explicação completa sobre o que são e pra que servem tipos de arquivos e extensões em um computador.
Como muitos sabem cada extensão é um tipo de arquivo diferente e existem varias extensões que representam o mesmo tipo de mídia. Isto porque cada um deles, os tipos de arquivos, tem sua particularidade em relação a formato e como os bytes que representam o seu conteúdo devem ser lidos, porem um software pode estar preparado para ler mais de um formato.
Hoje vou falar um pouco do tipo de mídia mais simples e comum que existem em um computador: o texto. Ou Melhor, nem tão simples assim, pois hoje os principais formatos de arquivos de texto não aceitam apenas texto, mais também imagens. Só que antes de falar dos tipos em si, vou falar da parte mais importante deste tipo de dado: a Codificação de Caracteres.
Você já deve ter percebido que usamos diversas no dia-a-dia diversas formas de padronizar os símbolos que usamos para nos comunicar certo? Por exemplo: temos os algarismos para representar números e as regras de apresentação deles. Também temos as letras que são organizadas em um alfabeto, em uma sequencia fixa e cada uma pode corresponder a um numero sequencial…. bingo… temos ai o conceito para a codificação de caracteres, mas neste caso, trocamos números por sequencias binárias e então teremos um conjunto que armazena símbolos e os identifica por seus códigos binários.
Na verdade a definição de Codificação de Caracteres é exatamente esta: é um padrão de relacionamento entre um conjunto de caracteres, com um conjunto de outra coisa, como por exemplo números ou pulsos elétricos com o objetivo de facilitar o armazenamento de texto em computadores e sua transmissão através de redes de telecomunicação.
Isto quer dizer então que o Codificação de Caracteres é o código morse digital? exatamente!
As mais populares são o Unicode e o ASCII que também é um dos mais antigos. O ASCII é a base da maioria das codificações modernas e consegue representar cerca de 128 caracteres entre as letras do alfabeto, sinais gráficos, pontuações, matemáticos e os caracteres chamados não-printáveis, já o Unicode representa mais de mais de 107 mil caracteres.
Os caracteres não-printáveis, que são conhecidos por caracteres de controle, servem para identificar marcações de texto, tais como parágrafos , tabulações, espaços, quebras de linha e outros que são usado para a transmissão de dados na rede. Entre as marcações padrão das codificações, há algumas que são do próprio software, que dão algumas funcionalidades especias para cada programa. Neste momentos entram então as extensões:
Quando estamos lidando com um arquivo de extensão “.txt”, estamos lidando com um arquivos de texto de pouca formatação e apenas texto, geralmente dentro do padrão ASCII e nenhuma marcação especial além das já codificadas pelo ASCII. Inicialmente não aceitava, negrito, itálico, sublinhado ou qualquer outra formatação de texto, também não aceitava tabulações como os alinhamentos a direita, a esquerda, centralizado ou justificado. Já os arquivos “.rtf” possuem mais marcações que possibilitam mais formatações, bem como a inserção de de imagens ou gráficos. O “.doc” alem de usar o padrão ”.rtf” como base, mas acrescenta uma série de novas marcações que possibilitam por exemplo a colocação de marcadores, rótulos, numerados, tabelas, etc.
Entre as extensões de texto mais comuns estão as acima citadas e também wri, pdf, docx, csv entre outros.
Bom galera, por hoje eu fico por aqui, mas na próxima semana teremos a explicação de mais de um tipo de mídia e suas extensões de arquivos.
Um grande abraço! Fui!
Ahhhh, agora sim!