XI Semana da Estatística - São Carlos - 2023
Renata Hirota é jornalista de dados, formada na ECA-USP e no IME-USP. Lida com dados desde 2017 e atualmente trabalha na Associação Brasileira de Jurimetria. Colabora também com projetos jornalísticos, analisando dados e desenvolvendo ferramentas para jornalistas. Faz parte da comunidade R-Ladies São Paulo, que promove a diversidade de gênero na comunidade da linguagem de programação R.
A Jurimetria utiliza métodos estatísticos e matemáticos para analisar dados jurídicos, buscando padrões e tendências.
Fazer jurimetria é pensar o direito de forma concreta: hipóteses que se manifestam ou não na realidade através das decisões judiciais.
Estudo clássico
Princípios jurídicos e pensamento de especialistas sobre o valor de indenização por dano moral a ser concedido no contexto de direito do consumidor.
Estudo jurimétrico
Valores típicos de dano moral em sentenças de primeira instância de processos envolvendo direito do consumidor no Tribunal de Justiça de São Paulo em 2020.
Dados
Modelo Semiparamétrico de Cox
cox <- survival::coxph(
survival::Surv(tempo, teve_guarda) ~ n_criancas + crianca_idade_meses_max,
data = adocaoDash::base_modelo_cox
)
summary(cox)
Call:
survival::coxph(formula = survival::Surv(tempo, teve_guarda) ~
n_criancas + crianca_idade_meses_max, data = adocaoDash::base_modelo_cox)
n= 24216, number of events= 4349
coef exp(coef) se(coef) z Pr(>|z|)
n_criancas2 0.6362883 1.8894547 0.0339151 18.76 <2e-16 ***
n_criancas3 1.6859974 5.3978322 0.0484086 34.83 <2e-16 ***
n_criancas4 ou mais 1.9034327 6.7088846 0.0808289 23.55 <2e-16 ***
crianca_idade_meses_max 0.0105088 1.0105642 0.0002458 42.76 <2e-16 ***
---
Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
exp(coef) exp(-coef) lower .95 upper .95
n_criancas2 1.889 0.5293 1.768 2.019
n_criancas3 5.398 0.1853 4.909 5.935
n_criancas4 ou mais 6.709 0.1491 5.726 7.861
crianca_idade_meses_max 1.011 0.9895 1.010 1.011
Concordance= 0.703 (se = 0.005 )
Likelihood ratio test= 2875 on 4 df, p=<2e-16
Wald test = 4175 on 4 df, p=<2e-16
Score (logrank) test = 4749 on 4 df, p=<2e-16
Taxas de falha proporcionais?
A razão das taxas de falha (adoção) de duas crianças diferentes pode variar com o tempo
Modelo logístico
Idade máxima da criança como covariável
fit_idade <- parsnip::logistic_reg() |>
parsnip::set_engine("glm") |>
parsnip::set_mode("classification") |>
parsnip::fit(
resposta_bin ~ crianca_idade_meses_max,
data = adocaoDash::base_modelo_log
)
parsnip::tidy(fit_idade)
# A tibble: 2 × 5
term estimate std.error statistic p.value
<chr> <dbl> <dbl> <dbl> <dbl>
1 (Intercept) -2.01 0.101 -19.9 1.07e-87
2 crianca_idade_meses_max 0.0186 0.00134 14.0 2.83e-44
.metric | .estimator | .estimate |
---|---|---|
accuracy | binary | 0.7282276 |
sens | binary | 0.9523810 |
spec | binary | 0.2309859 |
f_meas | binary | 0.8285004 |
# A tibble: 8 × 5
term estimate std.error statistic p.value
<chr> <dbl> <dbl> <dbl> <dbl>
1 (Intercept) -1.97 0.172 -11.4 3.22e-30
2 crianca_idade_meses_max 0.0141 0.00145 9.74 2.01e-22
3 n_criancas2 0.585 0.104 5.61 2.06e- 8
4 n_criancas3 2.39 0.287 8.33 8.39e-17
5 n_criancas4 ou mais 1.87 0.527 3.55 3.87e- 4
6 uf_AC -1.33 0.698 -1.90 5.76e- 2
7 uf_MA -0.946 0.467 -2.02 4.29e- 2
8 uf_MS 0.391 0.210 1.86 6.26e- 2
.metric | .estimator | .estimate |
---|---|---|
accuracy | binary | 0.7544858 |
sens | binary | 0.9542857 |
spec | binary | 0.3112676 |
f_meas | binary | 0.8427250 |
Apresentação: hirota.dev/sest2023
Contato: rhirota@abj.org.br