In gerbeldo/tidycell: CellID Data Analysis Inside the Tidyverse

knitr::opts_chunk$set(echo = TRUE)

library(tidyverse)
library(rcell2)

updateList <- function(l1, l2, only.common.names=T){
  if(!is.list(l2) | !is.list(l1)) stop("Error: input must be two named lists.")

  if(only.common.names){
    common.names <- names(l2)[names(l2) %in% names(l1)]
    l1[common.names] <- l2[common.names]
  } else{
    l1[names(l2)] <- l2[names(l2)]
  }
  return(l1)
}

Friendly reminder

MIRA LAS FOTOS CON IMAGEJ ANTES DE SEGUIR :D

CellID

Choose parameters

parameters <- "parameters_test.txt"

param_array <- c(
  "max_split_over_minor 0.50",
  "max_dist_over_waist 8.00",
  "max_pixels_per_cell 2000",
  "min_pixels_per_cell 75",
  "background_reject_factor 0.5",  # must be float! use a decimal point always
  "tracking_comparison 0.20",
  # "align_individual_cells",  # tambien se puede deshabilitar con un "#" en el mismo parameters.txt
  "align_fl_to_bf",
  "image_type brightfield",
  "bf_fl_mapping list")

write(param_array, file = parameters)

Imprimir contenidos del parameters.txt que generamos arriba:

writeLines(readLines(parameters))

Test many parameters

A prototype parameter list, with defaults:

param_list.o <- list(
  max_split_over_minor = 0.50,
  max_dist_over_waist = 8.00,
  max_pixels_per_cell = 2000,
  min_pixels_per_cell = 75,
  background_reject_factor = 0.75,
  tracking_comparison = 0.20,
  align_individual_cells = F,
  align_fl_to_bf = T,
  image_type = "brightfield",
  bf_fl_mapping = "list"
  )

Then, for each parameter variation, write a new parameters file.

In this example, only background_reject_factor is changed:

bgrf.min <- 0
bgrf.max <- 5
bgrf.new <- seq(from=bgrf.min, to=bgrf.max, length.out=10)

for (background_reject_factor.new in bgrf.new) {

  # Update prototype parameters
  param_list <- updateList(param_list.o, 
                           list(background_reject_factor = sprintf("%.3f", round(background_reject_factor.new,3)) ))

  # Process the list into a valid parameter list
  # converting values to character type
  param_array <- 
    sapply(seq_along(param_list), function(i) {
      # For each parameter, get its name and value
      item_val <- param_list[[i]]
      item_name <- names(param_list)[i]

      # Boolean values are for "flag" type parameters
      # Which enable a feature when present (eg. "align_fl_to_bf")
      if(isTRUE(item_val))
        r <- item_name
      # And, if absent, indicate default behavior:
      else if(isFALSE(item_val))
        r <- NA
      # Other parameters have values
      # which must be separated from names by a space " "
      else
        r <- paste0(item_name, " ", item_val)

      return(r)
      })

  # Filter any NAs (which come from FALSE flag-type parameters)
  param_array <- param_array[!is.na(param_array)]

  # Pretty name for the new parameters file
  parameters.mod <- paste0(format(round(background_reject_factor.new, 2), nsmall = 2), "_", parameters)

  # Write to the parameter file
  write(param_array, file = paste0("tests/", parameters.mod))
  print(parameters.mod)
}

Conseguir todos parameters.txt modificados:

path <- here::here("data/test_pics/")

parameters.mod <- dir(here::here("tests/"), pattern = "\\d+.*parameters_test.txt", full.names = T)

parameters.mod

Preparar dataframe de argumentos:

i = 1 # Elegir una foto sobre la que probar los diferentes parametros

arguments <- rcell2::cellArgs2(path = path,
                               # file.pattern = "^(BF|[A-Z]FP)_Position(\\d+)_time(\\d+).tif$",
                               file.pattern = "^(BF|[A-Z]FP)_Position(\\d+)().tif$",
                               parameters = parameters.mod[i])

arguments

Duplicar los archivos de BF con un nombre nuevo para cada parameters:

Mejora: nombrarlos por parameter modificado

# Duplicate test BF.tiff files (YFP needs not be if thread == 1)
test_bf <- arguments$bf
new_pos <- stringr::str_pad(string = 1:length(parameters.mod), width = 3, side = "left", pad = "0")
test_bf.new <- sapply(new_pos, function(a,b) sub(pattern = "\\d{3}", replacement = a, x = b), b = test_bf)
# Do the copying...
lapply(test_bf.new[-1], function(test_bf.n){
  file.copy(from = normalizePath(paste(path, test_bf, sep = "/"), mustWork = T),
            to = paste(path, test_bf.n, sep = "/"), overwrite = T
            )
})

Repetir la fila seleccionada del arguments dataframe, para crear nuevo dataframe con una fila por variación de parámeters.

Actualizar la columna parameters para que use los nuevos.

Actualizar la columna de bf para que usen un archivo diferente para cada BF.out.

También la de "pos" para que sean todos diferentes.

arguments.rep <- arguments[rep(1,length(parameters.mod)),]

arguments.rep$bf <- test_bf.new
arguments.rep$pos <- 1:length(parameters.mod)
arguments.rep$parameters <- normalizePath(parameters.mod)

arguments.rep

Correr CellID con un solo thread:

commands <- 
  rcell2::cell2(arguments.rep,
                cell.command = "~/Software/cellID-linux/cell",
                dry = F,
                no_cores = 1)

commands$commands

Leer fotitos:

bf.out.imgs.paths <- dir(path, pattern = "^BF.*.out.tif$", full.names = T)

bf.out.imgs <- magick::image_read(bf.out.imgs.paths) %>% 
  magick::image_annotate(round(bgrf.new,2), color = "white", size = 10, boxcolor = "black")

magick::image_append(bf.out.imgs, stack = T)

Generar arguments

Es un dataframe con información para CellID.

La opción más importante es file.pattern que es una expresión regular para encontrar archivos de imágenes en el path.

Por defecto es:

"^(BF|[A-Z]FP)_Position(\\d+)_time(\\d+).tif$"

Entre paréntesis están los "grupos de captura" de la expresión regular, donde se espera que esté la siguiente información:

Canal
Número de posición
Número de tiempo

Para no usar tiempo solo hay que borrar la parte del tiempo, dejando un paréntesis vacío en su lugar ():

"^(BF|[A-Z]FP)_Position(\\d+)().tif$"

Se puede "filtrar" posiciones y tiempos directo desde la regex, o posteriormente usando las funciones de R usuales. Para usar solo la posicion 2, y los tiempos 4, 2 y 3, la regex sería:

"^(BF|[A-Z]FP)_Position(?0+2)_time(?0+[423]).tif$"

Noten el 0+? enfrente del número, que indica que puede haber un cero o más frente al numerito de posición o tiempo en el nombre del archivo.

path <- "/home/nicomic/Software/cellID-linux/test_data_andy/"

arguments <- rcell2::arguments(path = path, 
                               file.pattern = "^(BF|[A-Z]FP)_Position(\\d+)_time(\\d+).tif$",
                               parameters = parameters)
arguments

Lo anterior sería lo mismo que filtrar con dplyr:

arguments %>% filter(pos == 2, t.frame %in% c(4,2,3))

Correr CellID

La función cell2 genera comandos para llamar a CellID por línea de comandos y los ejecuta en paralelo.

La opción dry = T indica a la función hacer "todo" menos ejecutar CellID, e imprime los comandos que habría usado.

Para correr los comandos, usen dry = F (aunque tambien pueden copiarlos y pegarlos en una terminal, si están en Linux o Mac OS).

rcell2::cell2(arguments = arguments, 
              cell.command = "~/Software/cellID-linux/cell",
              dry = T, no_cores = 2)

Cargar CellID data

Esto se hace con la función load_cell_data:

# cell.data <- rcell2::cell.load.alt(path =  path)
cell_data <- rcell2::load_cell_data(path = path)

Si esa no funciona, pueden intentar con cell.load.alt, aunque esta función no está tan probada.

Datos de máscaras

TIFF pixel ID

Si especificaron la opción encode_cellID_in_pixels en cell2, el CellID está codificado en la intensidad de pixel de las fotos de BF.out, y se puede cargar usando la funcion pic_df_from_tiff.

rcell2:::pic_df_from_tiff(tiff_path = "../data/image_samples/BF_Position001.tif.out.tif", image_bits = 16)

TSV output

Si especificaron la opción output_coords_to_tsv en cell2, hay un archivo TSV por posición con las coordenadas de los bordes y del interior todas las células en esa posición.

Pueden cargarlo y revisarlo así:

masks <- read_tsv("~/Software/cellID-linux/test_data_tmp/Position01/out_all_masks.tsv")

masks

Por ejemplo:

p1 <- ggplot(masks) + geom_tile(aes(x=x, y=y)) + facet_grid(flag~pixtype) + ggtitle("Todas las celulas")
p2 <- masks %>% filter(cellID == 0, t.frame == 0) %>% ggplot() + geom_tile(aes(x=x, y=y)) + facet_grid(flag~pixtype) + ggtitle("Una celula")

p1
p2

Usar datos de máscaras con Hu Moments

Para usar los datos de los TIFF, solo hace falta correr lo siguiente:

cell_data <- rcell2::append_hues(cell_data = cell_data, 
                                 return_points = T, 
                                 image_bits = 16)

rcell2:::check_tiff_mask(cell_data)

Para usar los TFP:

"test_hu_moments.Rmd"

gerbeldo/tidycell documentation built on Aug. 15, 2022, 2:35 p.m.

rdrr.io home R language documentation Run R code online

CRAN packages Bioconductor packages R-Forge packages GitHub packages

Note that we can't provide technical support on individual packages. You should contact the package authors for that.

gerbeldo/tidycell
CellID Data Analysis Inside the Tidyverse

In gerbeldo/tidycell: CellID Data Analysis Inside the Tidyverse

Friendly reminder

CellID

Choose parameters

Test many parameters

Generar arguments

Correr CellID

Cargar CellID data

Datos de máscaras

TIFF pixel ID

TSV output

Usar datos de máscaras con Hu Moments

R Package Documentation

Browse R Packages

We want your feedback!

gerbeldo/tidycell CellID Data Analysis Inside the Tidyverse

In gerbeldo/tidycell: CellID Data Analysis Inside the Tidyverse

Friendly reminder

CellID

Choose parameters

Test many parameters

Generar arguments

Correr CellID

Cargar CellID data

Datos de máscaras

TIFF pixel ID

TSV output

Usar datos de máscaras con Hu Moments

R Package Documentation

Browse R Packages

We want your feedback!

gerbeldo/tidycell
CellID Data Analysis Inside the Tidyverse