Paola Hemerly Sales
paolasales@gmail.com
Especialista em Gestão do Conhecimento e Inteligência Empresarial
Experientia – Itália
Graduada em Jornalismo e com pós graduação em “Gestão do Conhecimento e Inteligência Empresarial” e “Gestão da Comunicação e Marketing Institucional”, sua carreira profissional na área da User Experience começou como Content Manager, sendo aperfeiçoada para Arquiteta da Informação. Atualmente trabalha como User Experience Consultant, trabalhando em projetos internacionais de IA, usabilidade, pesquisas etnográficas e design da interação.
Sumário
Este documento visa descrever o projeto “Cultural Influence on Gestural Interfaces”, em processo de desenvolvimento em dez diferentes países em todo o mundo, objetivando entender quais são os gestos e movimentos mais naturais para a realização de tarefas em um dispositivo móvel touchscreen.
O intuito de apresentá-lo no 3º Encontro Brasileiro de Arquitetura de Informação é compartilhar a metodologia utilizada para a realização dos testes com usuários, os tipos de gestos e movimentos executados, bem como os recursos para registro e análise dos mesmos.
Os resultados que serão apresentados durante o evento dizem respeito a um dos países no qual o projeto está sendo realizado. Nesta proposta de trabalho, no entanto, está sendo abordada apenas a apresentação da metodologia, uma vez que os resultados ainda estão em processo de análise.
Palavras-chave
Dispositivos móveis; interfaces gestuais; reconhecimento de gestos; touchscreen; user experience; usabilidade; gesture study
1. Introdução
Falar em “dispositivos móveis com interfaces touchscreen”, até bem recentemente, era sinônimo de discursar sobre as funcionalidades oferecidas pelo iPhone da Apple. Mas em 2009 o mercado já apresenta outros aparelhos com a mesma função (ainda que não tão desenvolvida), como o Nokia XpressMusic 5800 ou o Blackberry Storm.
Do mesmo modo, ao se falar em reconhecimento de movimentos, ainda hoje o maior case de sucesso vem da Nintendo, com o seu Nintendo Wii, que parece permitir a reprodução de quaisquer gestos realizados pelo jogador dentro da realidade virtual de seus jogos. Os aparelhos celulares ainda não fornecem uma gama tão ampla de movimentos mas, ainda que de uma maneira mais restrita do que o Wii, o iPhone já reconhece alguns movimentos para girar uma foto, por exemplo.
Na figura 1, estão representados alguns dos principais cases de sucessos atuais em interfaces gestuais:
Se pensarmos em um futuro de curto prazo, a realidade do mercado proporcionará aos usuários um número cada vez maior de aparelhos celulares inteligentes, com o reconhecimento não só de toques, mas também de movimentos.
Nas últimas semanas blogs e sites dedicatos a assuntos como user experience e tecnologias móveis vêm divulgando uma lista de patentes[1] da Apple que prevê a identificação de impressões digitais para gestos. E o interesse da empresa é ainda mais específico: aparentemente os seus gestos do futuro dependerão também de qual dedo você utiliza para realizá-los (figura 2).
Com este cenário atual (e as previsões para o futuro próximo), é essencial entendermos como será a utilização desses dispositivos, ou seja, quais serão os gestos mais naturais dos usuários ao tentar, por exemplo, ouvir uma música no seu celular do futuro?
2. O projeto
Durante todo o ano de 2009, empresas que compõem uma rede mundial focada em usabilidade realizarão as primeiras fases do projeto “Cultural Influence on Gestural Interfaces” (“Influência cultural nas interfaces gestuais” – traduzido pelo autor) em dez diferentes países espalhados pelos continentes americano, europeu e asiático.
Com este projeto, será possível entender quais são os gestos naturais realizados pelas pessoas em todo o mundo, de acordo com as individualidades de cada país, bem como a facilidade de compreensão dos gestos já existentes no interior destas culturas.
A metodologia foi desenvolvida com a participação de profissionais responsáveis pela área de User Experience das empresas participantes desta rede mundial focada em usabilidade. O foco do seu desenvolvimento foi a simplicidade, excluindo a necessidade de muitos recursos técnicos.
Para facilitar o acesso aos usuários e, consequentemente, possibilitar uma amostra mais representativa, as sessões individuais foram construídas de modo a não dependerem de um laboratório para sua realização.
Do mesmo modo, a execução dos testes e a análise dos resultados foram planejadas potencializando sua aplicabilidade em qualquer lugar do mundo. Com sessões de aproximadamente 45 minutos, o protocolo de teste abrange as principais tarefas que uma pessoa pode (ou poderá) realizar em seu dispositivo móvel touchscreen, solicitando que o usuário as execute não só com gestos touchscreen, mas também movimentos utilizando a 3ª dimensão.
O projeto proposto para o 3º Encontro Brasileiro de Arquitetura de Informação abordará os resultados obtidos em uma das localidades em que está sendo realizado. Devido ao cronograma do projeto principal, não será possível apresentar os dados consolidados dos dez países participantes, mas a apresentação da metologia será ilustrada com os resultados dos testes realizados com 40 usuários em um dos países envolvidos.
2.1 Os objetivos
O relatório final do projeto destacará os gestos intuitivos realizados por pessoas em várias culturas e a compreensão dos mesmos no interior de cada cultura.
Com o foco em dispositivos touchscreen, este projeto servirá de suporte para designers em todo o mundo no desenvolvimento de futuras interfaces gestuais, na criação de novos gestos e aperfeiçoamento daqueles já existentes.
Desta forma, este projeto busca o conhecimento de quais gestos são universalmente naturais e compreensíveis. Conhecimento este que se revela um diferencial muito valioso, que certamente será utilizado como referência em pesquisas futuras e amplamente utilizado por profissionais envolvidos no desenvolvimento de interfaces para dispositivos móveis.
2.2 As fases
O projeto “Cultural Influence on Gestural Interfaces” prevê três fases:
- Desktop research: mapeamento da literatura já existente em cada país (incluindo artigos científicos, materiais públicos em jornais e revistas, etc.) bem como a experiência individual de cada empresa em prévios projetos relacionados ao design de interfaces touchscreen. Cada país participante do projeto é convidado a analisar os detalhes desta pesquisa para identificar quais materiais podem ser inseridos na desktop research;
- Sessões “one-on-one”: observação de pessoas realizando movimentos e gestos naturais para simular a utilização de um dispositivo móvel touchscreen. Estas sessões possuem dois objetivos principais: recolher um conjunto de gestos que podem ser utilizados para evocar ações no aparelho touchscreen e conversar com as pessoas sobre seus gestos e o raciocínio seguido para sua execução;
- Pesquisa online: validação dos dados coletados durante as sessões “one-on-one” em um grupo aproximadamente cinco vezes maior, online. A análise desta fase do projeto consistirá na identificação do gesto reconhecido por um maior número de pessoas como o gesto mais adequado para cada tarefa proposta.
3. Público-alvo
A escolha do público-alvo para as duas fases que prevêem a participação de usuários possui como base a experência prévia com dispositivos multitouch screen, ou seja, aparelhos celulares ou quaisquer outros dispositivos handheld que permitam a utilização de mais de um dedo ao mesmo tempo.
Desta maneira, o grupo representativo de usuários apresenta uma divisão igualitária entre usuários com experiência em dispositivos multitouch (que possui um atualmente ou que já possuiu no passado) e os usuários sem alguma experiência prévia com dispositivos touchscreen (mesmo aqueles que restrigem a execução de gestos a um dedo).
Características adicionais do público-alvo incluem a idade (entre 20 e 60 anos), gênero (divisão igual entre os sexos) e o fato de que todos os participantes deveriam obrigatoriamente ter a língua do país como língua-mãe (“native speakers”).
4. Equipamento
O equipamento utilizado para apreender os gestos executados pelos participantes foi construído por uma das empresas participantes especialmente para o projeto “Cultural Influence on Gestural Interfaces”.
O Gesture Rig (figura 3) é um protótipo que permite ao usuário simular a utilização de um dispositivo móvel touchscreen, ao mesmo tempo que permite ao moderador registrar todos os gestos utilizando uma webcam.
Graças ao caráter portátil do equipamento, as sessões não precisam ser realizadas em um laboratório, garantindo maior flexibilidade na coleta de dados.
4.1 Os componentes do equipamento
O Gesture Rig é composto por uma base, uma haste e a câmera para registro dos movimentos diretamente no computador.
A sua base (figura 4) possui o objetivo de simular um aparelho handheld com touchscreen (sua aparência e tamanho são semelhantes ao iPhone da Apple).
Para a realização dos testes, esta base serve de suporte para as imagens impressas (screenshots que simulam operações no aparelho touchscreen) e para o seu plástico de proteção (Plexiglas), que se encaixa perfeitamente na base permitindo que os gestos sejam capturados pela webcam.
Durante as sessões o usuário pode segurar a base em suas mãos para melhor simular a utilização de um aparelho handheld, ou ser mantido em uma base (como uma mesa, por exemplo) para garantir maior equilíbrio para a webcam.
Sua haste, feita de alumínio, tem o objetivo de servir de base para a webcam, segurar o cabo e manter a câmera a uma distância consistente para a gravação dos movimentos do usuário.
A câmera indicada para este tipo de estudo é uma webcam capaz de registrar video e audio em uma resolução aproximada de 640/480 em dez frames por segundo. A figura 5 mostra um exemplo da imagem capturada por uma webcam Logitech Quickcam Deluxe, utilizada no estudo aqui apresentado.
5. Tipos de gestos
Durante as sessões individuais, cada gesto do participante é analisado em detalhes a partir de parâmetros específicos de acordo com seu tipo. Eles podem ser gestos de manipulação direta, simbólicos ou combinados:
- Gestos de manipulação direta (“direct manipulation gestures”): gestos que permitem ao usuário manipular diretamente um objeto ou espaço em branco na tela, como por exemplo selecionar com um toque ou arrastar;
- Gestos simbólicos (“symbolic gestures”): gestos que determinam um comando mais abstrato ao dispositivo, como, por exemplo, fazer um “X” para apagar algum objeto. Os gestos simbólicos são aqueles que apresentam maior potencial para apresentar diferenciais entre culturas;
- Gestos combinados (“combination gestures”): gestos compostos de um (ou mais) gesto de manipulação direta com um (ou mais) gesto simbólico, como, por exemplo. selecionar com um toque e depois fazer um “X” para apagar um determinado objeto.
Os parâmetros específicos de acordo com o tipo de gesto incluem sua direção, localização, repetição (para gestos de manipulação direta), natureza, caracteres, língua (para gestos simbólicos), ordem, número e tipo de gestos (para os gestos combinados).
Além disso, são analisados também o número de dedos utilizados para sua execução e, quando necessário, quais menus ou botões contextuais são requisitados pelo usuário.
A figura 6 ilustra exemplos de gestos realizados durante as sessões:

Figura 6 - Exemplos de Gestos de manipulação direta, simbólicos e combinados (clique na imagem para ampliar)
5.1 Gestos em 3ª dimensão
O projeto “Cultural Influence on Gestural Interfaces” prevê também um capítulo opcional que aborda os gestos em 3ª dimensão durante as sessões “one-on-one”.
Durante a maior parte do teste, o usuário é convidado a realizar gestos tocando o aparelho. Nesta parte final, no entanto, o objetivo é analisar os gestos executados apenas segurando o aparelho e movendo-o (algo similar ao que existe hoje com o Nintendo Wii), bem como os gestos executados no ar sem tocar o aparelho de modo algum (como se o aparelho reconhecesse os gestos realizados na sua frente, sem algum toque).
As sessões realizadas no país que está fornecendo este case de estudo para ser apresentado no 3º Encontro Brasileiro de Arquitetura de Informação incluíram este capítulo adicional, portanto será possível apresentar também os resultados a respeito deste tipo de interação com aparelhos móveis (em fase de análise).
6. Tarefas
Cada sessão do projeto prevê a realização de 28 tarefas touchscreen e 8 tarefas 3D sem tocar a tela do aparelho (4 tarefas que devem ser executadas com o movimento do aparelho e 4 tarefas que devem ser executadas com o movimento das mãos no ar, no espaço localizado na frente do aparelho).
A seguir serão listadas as 36 tarefas:
- Selecionar múltiplos objetos
- Mover objeto
- Apagar objeto
- Rolar (scroll) a tela para a página seguinte
- Rolar (scroll) a tela para a página anterior
- Rolar (scroll) a tela para chegar rapidamente até o item 500 de uma lista de 1000 itens
- Interromper o scroll iniciado na tarefa anterior
- Abrir um menu contextual
- Abrir uma pasta
10. Fechar uma pasta
11. Aceitar uma modificação
12. Ir para a homepage
13. Acessar a área de ajuda (Help)
14. Zoom in
15. Zoom out
16. Aumentar a fonte de um pedaço de um texto
17. Girar imagem
18. Girar a imagem no espaço (em 3D)
19. Salvar
20. Imprimir
21. Minimizar
22. Voltar à página anterior
23. Ir à página seguinte
24. Cortar um trecho de um texto
25. Colar um trecho de um texto
26. Desfazer uma ação
27. Refazer uma ação
28. Copiar um trecho de um texto
29. Começar uma música movendo o aparelho
30. Parar uma música movendo o aparelho
31. Passar à música seguinte movendo o aparelho
32. Recomeçar a música sem tocar o aparelho, apenas movendo as mãos
33. Começar uma música sem tocar o aparelho, apenas movendo as mãos
34. Parar uma música sem tocar o aparelho, apenas movendo as mãos
35. Passar à música seguinte sem tocar o aparelho, apenas movendo as mãos
36. Recomeçar a música sem tocar o aparelho, apenas movendo as mãos
As figura seguinte (figura 7) apresenta exemplos das imagens apresentadas aos usuários para a realização das tarefas acima listadas. Para cada figura, a imagem à esquerda representa a tela antes do gesto e, à direita, a tela depois do gesto.

Figura 7 – Exemplo de tarefas: abrir uma pasta e girar a imagem no espaço (clique na imagem para ampliar)
Durante o teste, o moderador apresenta as duas imagens para os usuários, orientando-os a executar um gesto que os levaria à imagem seguinte. Além disso, no Gesture Rig está sempre presente uma cópia da imagem “antes”.
6.1 Apreensão dos gestos
Para assegurar a correta apreensão dos gestos realizados durante as sessões, os usuários são solicitados a sujar os dedos com carvão. Para melhor conforto, é oferecida também a possibilidade de utilizar uma luva.
Com o uso do carvão, ao efetuar os gestos no Plexiglas (plástico de proteção que é colocado acima da imagem impressa do screenshot), permanece a marca negra do material.
A figura 8 apresenta todos os materiais utilizados durante as sessões:
- fichário com os screenshots: para apresentar ao usuário a imagem que ele veria na tela antes e depois de sua ação;
- luvas para a realização dos gestos: opcional, no caso do usuário não se sentir à vontade para sujar os dedos com o carvão;
- lenços de papel: para limpeza do Plexiglas após cada tarefa e também dos dedos do usuário após a realização dos 28 gestos touchscreen:
- Gesture rig montado para a sessão: com a pilha de imagens impressas de screenshots, o plástico Plexiglas em cima e a webcam acoplada à haste;
- carvão: utilizado pelo usuário para sujar os dedos (ou a luva) e registrar os movimentos no Plexiglas
Além dos materiais apresentados na figura 8, é imprescindível a presença de um computador, no qual a webcam estará conectada e onde toda a sessão será registrada.
7. Análise
Os testes realizados em cada um dos países participantes do projeto têm seus dados analisados de acordo com a proposta aprovada pelos membros da rede mundial de empresas. Cada gesto realizado por cada participante é catalogado de acordo com o código de gestos disponível na biblioteca de gestos comum aos participantes do projeto.
Cada gesto realizado pelo participante que não se ajusta a nenhum dos outros gestos já catalogados na biblioteca passa por um processo de descrição mais detalhado para ser um novo ítem cadastrado. Consequentemente, será utilizado a partir daquele momento como referência para as sessões que ainda não foram analisadas, seja no mesmo país ou nos outros países onde os testes estão sendo realizados.
O arquivo com todos os gestos catalogados é disponível online para atualização por todas as empresas participantes do projeto. A figura 9 apresenta um screenshot do ambiente de compartilhamento da biblioteca de gestos.
O processo de análise dos testes realizados no país utilizado para este trabalho ainda não foi finalizado. Durante o 3º Encontro Brasileiro de Arquitetura de Informação será possível apresentar os resultados, de modo a facilitar a apresentação de toda a metologia, bem como de seu valor para futuras pesquisas a serem realizadas.
8. Referências
Clamann, M; Mauney, D; Carl, A; Thalmeier, S. (2009). Session guide for the project Cultural Influence on Gesture Studies. (documento interno).
Kim, Arnold. (2009). Haptic Tactile Feedback. Disponível em: http://www.macrumors.com/2009/07/02/haptic-feedback-fingerprint-identification-and-rfid-tag-readers-in-future-iphones/. Acesso em 05 de julho de 2009.
[1] Lista de patentes disponível no site http://www.macrumors.com/2009/07/02/haptic-feedback-fingerprint-identification-and-rfid-tag-readers-in-future-iphones/ (acesso em 05 de julho de 2009)














