Ao contrário do nosso alfabeto que é caracterizado por letras que representam fonemas, o alfabeto chinês é caracterizado por ideogramas em que cada um corresponde a um conceito. Dependendo do dialecto cada ideograma pode ser pronunciado de maneira diferente.
Como cada ideograma sozinho representa uma ideia, às vezes utilizam-se mais do que um ideograma para representar uma ideia. Por exemplo, computador escreve-se電腦(Diànnǎo) e é composto por 電 que significa electricidade e 腦 que significa cérebro. O computador é portanto um "cérebro eléctrico".
Estima-se que existam mais de 150.000 caracteres na língua chinesa, para simplificar a apreendizagem dos caracteres eles estão dividos em quatro conjuntos.
- Ideogramas do primeiro conjunto - são os ideogramas criados a partir da observação da natureza, formam os primeiros a ser criados. Exemplos: 山 lê-se Shān e significa Montanha; 日 lê-se Ri e significa Sol ou Dia; 月 lê-se Yuè e significa Lua ou Mês
- Ideogramas do segundo conjunto - são os ideogramas que representam convensões. Exemplos:四 lê-se Shi e representa o número quatro; 中 lê-se Zhōng e siginfica centro ou meio; 上 lê-se Shàng e significa em cima ou sobre.
- Ideogramas do terceiro conjunto - são os ideograms que resultam da justaposição ou da combinação de outros ideogramas. Exemplos: 明 lê-se Míng e significa brilho e é composto pelo hanji de dia mais o hanji de lua.