Como usamos estatística para ajudar no processo de adoção de crianças

XI Semana da Estatística - São Carlos - 2023

Olá! 👋

Renata Hirota é jornalista de dados, formada na ECA-USP e no IME-USP. Lida com dados desde 2017 e atualmente trabalha na Associação Brasileira de Jurimetria. Colabora também com projetos jornalísticos, analisando dados e desenvolvendo ferramentas para jornalistas. Faz parte da comunidade R-Ladies São Paulo, que promove a diversidade de gênero na comunidade da linguagem de programação R.

hirota.dev | abj.org.br

O que é Jurimetria?

A Jurimetria utiliza métodos estatísticos e matemáticos para analisar dados jurídicos, buscando padrões e tendências.

O que é Jurimetria?

Fazer jurimetria é pensar o direito de forma concreta: hipóteses que se manifestam ou não na realidade através das decisões judiciais.

Exemplo

Estudo clássico

Princípios jurídicos e pensamento de especialistas sobre o valor de indenização por dano moral a ser concedido no contexto de direito do consumidor.

Estudo jurimétrico

Valores típicos de dano moral em sentenças de primeira instância de processos envolvendo direito do consumidor no Tribunal de Justiça de São Paulo em 2020.

Aplicações da Jurimetria

  • Predição de decisões judiciais
  • Análise de tendências
  • Eficiência e celeridade processual

Dados

  • Decisões
  • Metadados de processos (assunto, classe)

Métodos utilizados

  • Estatística descritiva
  • Regressão linear
  • Regressão logística
  • Análise de sobrevivência
  • Webscraping
  • Visualização de dados
  • Relatórios automatizados

Alguns projetos da ABJ

Varas empresariais especializadas

Varas empresariais especializadas

  • Processos de direito empresarial tomam o dobro do tempo dos magistrados
  • Processos de recuperação judicial tomam o triplo do tempo dos magistrados

Estudo: https://abj.org.br/pesquisas/varas-empresariais/

Perfis de crianças e tempo de espera de adoção

  • Estudo sobre tempo de espera de adoção de crianças
  • Perfil das crianças disponíveis incompatível com perfil desejado por pretendentes

Estudo: https://abj.org.br/pesquisas/adocao/

Perfis de crianças e tempo de espera de adoção

Adoção: dashboard para pretendentes

  • Parceria com o CNJ
  • Dados do Sistema Nacional de Adoção e Acolhimento
  • Tempo até habilitação e adoção

Adoção: dashboard para pretendentes

Adoção: dashboard para pretendentes

Modelo Semiparamétrico de Cox

  • Coeficientes \(\beta\) que medem os efeitos das covariáveis sobre a função de taxa de falha
  • Covariáveis:
    • Idade máxima da criança
    • Número de crianças aceitas

Modelo Semiparamétrico de Cox

cox <- survival::coxph(
  survival::Surv(tempo, teve_guarda) ~ n_criancas + crianca_idade_meses_max,
  data = adocaoDash::base_modelo_cox
)
summary(cox)
Call:
survival::coxph(formula = survival::Surv(tempo, teve_guarda) ~ 
    n_criancas + crianca_idade_meses_max, data = adocaoDash::base_modelo_cox)

  n= 24216, number of events= 4349 

                             coef exp(coef)  se(coef)     z Pr(>|z|)    
n_criancas2             0.6362883 1.8894547 0.0339151 18.76   <2e-16 ***
n_criancas3             1.6859974 5.3978322 0.0484086 34.83   <2e-16 ***
n_criancas4 ou mais     1.9034327 6.7088846 0.0808289 23.55   <2e-16 ***
crianca_idade_meses_max 0.0105088 1.0105642 0.0002458 42.76   <2e-16 ***
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

                        exp(coef) exp(-coef) lower .95 upper .95
n_criancas2                 1.889     0.5293     1.768     2.019
n_criancas3                 5.398     0.1853     4.909     5.935
n_criancas4 ou mais         6.709     0.1491     5.726     7.861
crianca_idade_meses_max     1.011     0.9895     1.010     1.011

Concordance= 0.703  (se = 0.005 )
Likelihood ratio test= 2875  on 4 df,   p=<2e-16
Wald test            = 4175  on 4 df,   p=<2e-16
Score (logrank) test = 4749  on 4 df,   p=<2e-16

Problemas

Problemas

Taxas de falha proporcionais?

A razão das taxas de falha (adoção) de duas crianças diferentes pode variar com o tempo

  • Sabemos que a idade da criança é importante no perfil
  • Processo de adoção é longo e pode demorar meses/anos.

Outra abordagem

Modelo logístico

  • Dados de 2019 a 2022
  • Dadas as características, houve adoção em até 3 anos?

Modelo logístico

Idade máxima da criança como covariável

fit_idade <- parsnip::logistic_reg() |>
  parsnip::set_engine("glm") |>
  parsnip::set_mode("classification") |>
  parsnip::fit(
    resposta_bin ~ crianca_idade_meses_max,
    data = adocaoDash::base_modelo_log
  )
parsnip::tidy(fit_idade)
# A tibble: 2 × 5
  term                    estimate std.error statistic  p.value
  <chr>                      <dbl>     <dbl>     <dbl>    <dbl>
1 (Intercept)              -2.01     0.101       -19.9 1.07e-87
2 crianca_idade_meses_max   0.0186   0.00134      14.0 2.83e-44

Modelo logístico

.metric .estimator .estimate
accuracy binary 0.7282276
sens binary 0.9523810
spec binary 0.2309859
f_meas binary 0.8285004

Curca ROC

Probabilidade de adoção X idade

Modelo final

# A tibble: 8 × 5
  term                    estimate std.error statistic  p.value
  <chr>                      <dbl>     <dbl>     <dbl>    <dbl>
1 (Intercept)              -1.97     0.172      -11.4  3.22e-30
2 crianca_idade_meses_max   0.0141   0.00145      9.74 2.01e-22
3 n_criancas2               0.585    0.104        5.61 2.06e- 8
4 n_criancas3               2.39     0.287        8.33 8.39e-17
5 n_criancas4 ou mais       1.87     0.527        3.55 3.87e- 4
6 uf_AC                    -1.33     0.698       -1.90 5.76e- 2
7 uf_MA                    -0.946    0.467       -2.02 4.29e- 2
8 uf_MS                     0.391    0.210        1.86 6.26e- 2

Modelo final

.metric .estimator .estimate
accuracy binary 0.7544858
sens binary 0.9542857
spec binary 0.3112676
f_meas binary 0.8427250

Curva ROC

Probabilidade predita e proporção empírica

Média das probabilidades preditas e proporções empíricas

Resultado

Obrigada!

Apresentação: hirota.dev/sest2023

Contato: rhirota@abj.org.br