INDICE DÉRIVÉ DU RELEVÉ DE LA CIFP {#app:iphc-survey-index}

yyr_set_counts <- readRDS(paste0(file.path(dc, "iphc/yelloweye-rockfish.rds")))$set_counts
dog_set_counts <- readRDS(paste0(file.path(dc, "iphc/north-pacific-spiny-dogfish.rds")))$set_counts

bait_set_counts <- readRDS(paste0(file.path(dc, "iphc/hook-with-bait.rds")))$set_counts

La Commission internationale du flétan du Pacifique (CIFP) effectue un relevé annuel à la palangre pour l’évaluation des stocks dans les eaux de la Californie à l’Alaska, y compris les eaux de la Colombie-Britannique [@flemming2012iphc]. Le but principal du relevé est de fournir des données sur le flétan du Pacifique (Hippoglosus stenolepis) à des fins d’évaluation des stocks.

À chaque station, l’engin de pêche se compose d’un jeu de patins d’environ 100 hameçons chacun. Il y a jusqu’à huit patins sur chaque ensemble, le nombre de patins par ensemble variant d’une année à l’autre. Pour chaque ensemble, la CIFP calcule un 'nombre de patins efficaces', que nous utilisons ici pour mettre à l’échelle le nombre de spécimens de chaque espèce d’intérêt et obtenir un taux de prises pour chaque ensemble (décrit ci-après). Le nombre de patins efficaces permet de "normaliser les données de relevé pour les années où le nombre d’hameçons, l’espacement entre les hameçons ou le type d’hameçon varient " [@yamanaka2008iphc]. Un patin efficace représente un patin de 100 hameçons circulaires avec un espacement de 18 pieds [@yamanaka2008iphc].

Pour les eaux de la Colombie-Britannique, le relevé a permis de recenser des espèces autres que le flétan depuis 1995 (à divers degrés d’identification des espèces). Pour chaque espèce, le taux de prises au sein d’un ensemble est le nombre d’individus capturés par patin efficace. Ces taux de prises sont autogénérés à l’intérieur de chaque année pour qu’on puisse obtenir des moyennes annuelles autogénérées, des intervalles de confiance à 95\% autogénérés corrigés et ajustés (BCa) et des coefficients de variation (CV) autogénérés [@efron1987].

Toutefois, des complications surviennent en raison de protocoles de collecte de données différents d’une année à l’autre. Nous recherchons un indice dérivé du relevé qui couvre une période aussi longue que possible et, idéalement, couvre également toutes les eaux côtières au large de la Colombie-Britannique (à l’exception du détroit de Georgia dans lequel le relevé de la CIFP n’a pas été réalisé). Bien que la couverture spatiale et les détails techniques du relevé ne soient pas uniformes d’une année à l’autre (tel que décrit ci-après), nous tentons de construire un indice dérivé du relevé pour autant d’espèces que possible et pour une période aussi longue que possible. Nous déterminons également si chaque indice peut être considéré comme étant représentatif de toutes les eaux de la Colombie-Britannique. Pour chaque espèce, l’indice qui en résulte donne ce que nous appelons la série de relevés indépendants de la pêche de la Commission internationale du flétan du Pacifique (CIFP).

La démarche adoptée est décrite ci-après et s’appuie sur celle qui a été élaborée pour l’évaluation du sébaste à bandes rouges [@edwards2017redbanded] et du sébaste aux yeux jaunes [@yamanaka2018yelloweyeoutside]. L’évaluation du sébaste à bandes rouges a été la première durant laquelle on a élaboré un indice de l’abondance à partir des relevés de la CIFP, lesquels remontent à 1995 et comprennent des données jusqu’en 2012. En ce qui concerne l’évaluation du sébaste aux yeux jaunes, les méthodes ont été étendues pour qu’on puisse démontrer que l’indice fondé sur les eaux situées au nord de l’île de Vancouver pouvait être considéré comme étant représentatif de la population de l’ensemble de la côte. Voir ces exemples qui ont fait l’objet d’un travail pour la plupart des calculs suivants.

DONNÉES DE LA CIFP

Dans les eaux de la Colombie-Britannique (zone 2B de la CIFP), depuis 2003, un troisième observateur a participé au relevé de la CIFP pour déterminer toutes les prises à l’échelon de l’espèce hameçon par hameçon et pour effectuer un échantillonnage biologique [@flemming2012iphc], bien que cet observateur ait été absent en 2013. Des observateurs ont également été déployés avant 2003, bien que les données ne soient pas disponibles de manière aussi détaillée, comme le résume le tableau \@ref(tab:IPHCdata). Pour certaines années, seuls les 20 premiers hameçons de chaque patin ont fait l’objet d’un dénombrement, et pour les autres années, tous les hameçons ont fait l’objet d’un dénombrement, mais les données ne sont disponibles que pour l’ensemble (c’est-à-dire que nous ne savons pas quel hameçon a capturé quelle espèce, mais seulement combien d’individus de chaque espèce ont été capturés dans l’ensemble). Les données ont été extraites de diverses feuilles de calcul et de la base de données GFBio du MPO, et toutes provenaient à l’origine de la CIFP. Les emplacements qui se situent au large de la côte ouest de l’île de Vancouver (COIV) n’ont fait l’objet d’un échantillonnage que pendant quelques années. Il est à noter que, par souci de simplicité, nous utilisons le terme '20 premiers hameçons', car les échantillonneurs à bord des bateaux visaient généralement les 20 premiers hameçons déployés pour chaque patin. Cependant, pour des raisons opérationnelles (en particulier dans les zones où les taux de prises sont élevés), il arrive que les 20 hameçons proviennent d’ailleurs dans un patin mais représentent toujours 20 hameçons consécutifs [p. ex., @dykstra2002iphc].

\vspace{0mm}

\begin{table}[t] \centering \caption{Résumé des données disponibles issues des relevés à la palangre menés dans le cadre de l’évaluation des stocks de la CIFP. 'Résolution des données' indique à quel niveau les données sont disponibles, et 'COIV' (Côte Ouest de l’île de Vancouver)indique si le relevé comprenait des emplacements situés au large de la côte ouest de l’île de Vancouver ou non. 'Emplacement des données' indique à partir de quelle source les données ont été consultées, la base de données GFBio du MPO ou les feuilles de calcul. $^1$Pour 1995, les données biologiques se trouvaient dans le fichier "1995_IPHC_SSA_Rockfish_catch_from_Kelly_Ames.xls" sur le disque partagé concernant les sébastes côtiers du MPO, et les patins efficaces ont été obtenus de Aaron Ranta (CIFP) dans le fichier "1995EffSktValues by Station.xlsx". $^2$Pour 1996-2002, les données se trouvaient dans le fichier "2B AllSpecies 96-02 roundIII.xls", qui provenait à l’origine de la CIFP. $^3$Pour 2013, les données se trouvaient dans le fichier "2013 20-Hook Data.xls", qui provenait à l’origine de la CIFP. Pour faciliter l’accès, les données tirées des feuilles de calcul sont maintenant toutes incluses dans notre progiciel gfiphc.} \label{tab:IPHCdata} \begin{tabular}{llllc} \hline Année & Hameçons ayant fait & Résolution & Emplacement & COIV?\ & ~l’objet d’un dénombrement & ~des données & ~des données\ \hline 1995 & Tous & Ensemble par & Feuilles de calcul$^1$ & N\ & & ~ensemble & & \ 1996 & Tous & Ensemble par & Feuille de calcul$^2$ & N\ & & ~ensemble$^2$ & & \ 1997-1998 & 20 premiers hameçons & Ensemble par & Feuille de calcul$^2$ & N\ & ~de chaque patin & ~ensemble & & \ 1999 & 20 premiers hameçons & Ensemble par & Feuille de calcul$^2$ & Y\ & ~de chaque patin & ~ensemble & & \ 2000 & 20 premiers hameçons & Ensemble par & Feuille de calcul$^2$ & N\ & ~de chaque patin & ~ensemble & & \ 2001-2002 & 20 premiers hameçons & Ensemble par & Feuille de calcul$^2$ & Y\ & ~de chaque patin & ~ensemble & & \ 2003-2011 & Tous & Hameçon par & Base de données & Y\ & & ~hameçon & ~ GFBio du MPO & \ 2012 & Tous (expérience & Hameçon par & Base de données & Y\ & ~avec appâts) & ~hameçon & ~ GFBio du MPO& \ 2013 & 20 premiers hameçons & Ensemble par & Feuille de calcul$^3$ & Y\ & ~de chaque patin & ~ensemble & & \ 2014-2018 & Tous & Hameçon par & Base de données & Y\ & & ~hameçon & ~ GFBio du MPO& \ \hline \end{tabular} \end{table}

D’après le tableau \@ref(tab:IPHCdata), quatre questions se dégagent :

  1. Pour la période s’échelonnant entre 1997 et 2002 et en 2013, seuls les 20 premiers hameçons de chaque patin ont fait l’objet d’un dénombrement, alors que pour toutes les autres années, tous les hameçons ont fait l’objet d’un dénombrement. Ainsi, les données de chaque année ne peuvent pas être simplement considérées comme étant comparables et analysées comme une série chronologique consécutive.

  2. Pour les ensembles de données de 1995, 1996, 1997-2002 et 2013, les données ne sont disponibles qu’au niveau ensemble par ensemble, en termes de nombre de spécimens d’une espèce donnée par patin efficace. L’espèce capturée sur chaque hameçon n’est pas disponible, contrairement aux résultats enregistrés pour les périodes allant de 2003 à 2012 et de 2014 à 2018. Ainsi, pour 1995 et 1996, nous ne pouvons pas calculer les taux de prises sur la base des 20 premiers hameçons (parce que nous ne disposons que de données au niveau ensemble par ensemble), alors que nous pouvons le faire pour les périodes allant de 2003 à 2012 et de 2014 à 2018, et les données recueillies sur la base de 20 hameçons sont les seules informations dont nous disposons pour la période allant de 1997 à 2002 et pour 2013.

  3. En 2012, une expérience à l’aide d’appâts a été menée de telle sorte que les données pour tous les patins ne pouvaient pas être utilisées; voir la section \@ref(sec:chum).

  4. La COIV n’a pas été visitée chaque année, de sorte que la couverture spatiale n’est pas uniforme d’une année à l’autre.

\begin{table}[t] \centering \caption{ Résumé de la façon dont les quatre séries {\bf A}, {\bf B}, {\bf C} et {\bf D} sont construites. Les chiffres entre parenthèses indiquent le nombre d’années pour lesquelles des données sont disponibles pour chaque série. 'Seules le nord de la COIV' indique une série qui ne tient compte que des stations situées au nord de l’île de Vancouver (excluant ainsi celles situées au large de la COIV), et 'Ensemble de la côte' indique une série qui utilise toutes les stations de l’ensemble de la côte. Les lignes indiquent le nombre d’hameçons sur lesquels sont fondés les taux de prises pour chaque série.} \label{tab:seriesSumm} \begin{tabular}{rcc} \hline & Seules le nord de la COIV & Ensemble de la côte\ \hline Vingt premiers hameçons de chaque patin & {\bf A}(22) & {\bf D}(19)\ Tous les hameçons de chaque patin & {\bf B}(17) & {\bf C}(15)\ \hline ~\% pour ajouter des espaces avant que le texte ne se poursuive. \end{tabular} \end{table}

Pour traiter les questions 1, 2 et 4, nous construisons donc quatre séries chronologiques (dont la structure est résumée dans le tableau \@ref(tab:seriesSumm)) pour chaque espèce :

Série A – 1997-2018, stations situées au nord de la COIV, avec des taux de prises fondés sur les 20 premiers hameçons seulement (c’est tout ce dont nous disposons pour la période allant de 1997 et 2002 et pour 2013).

Série B – 1995, 1996, 2003-2012 et 2014-2018, stations situées au nord de la COIV, avec des taux de prises fondés sur tous les hameçons (c’est tout ce dont nous disposons pour 1995 et 1996).

Série C – périodes allant de 2003 à 2012 et de 2014 à 2018, stations côtières (y compris la COIV), avec des taux de prises fondés sur tous les hameçons.

Série D – 1999 et période allant de 2001 à 2018, stations côtières (y compris la COIV), avec des taux de prises fondés sur les 20 premiers hameçons seulement (c’est tout ce dont nous disposons pour 1999, 2001-2002 et 2013).

Nous aimerions obtenir une série d’indices avec une durée aussi longue que possible et, idéalement, sur une région géographique aussi vaste que possible. Comme la série A est la série chronologique la plus longue, nous l’étendons à la série AB, définie comme suit :

Série AB – pour les stations situées au nord de la COIV, en combinant les valeurs de la série B pour 1995 et 1996, fondées sur tous les hameçons, avec les valeurs de la série A pour la période allant de 1997 à 2018, fondées sur les 20 premiers hameçons seulement. Voir la section \@ref(sec:iphc-equations)

La série AB qui en résulte couvre les stations situées au nord de la COIV. Dans les sections \@ref(sec:iphc-AD) et \@ref(sec:iphc-BC), nous montrons comment nous déterminons, pour chaque espèce, si nous pouvons considérer cette série comme étant représentative de l’ensemble de la côte (c.-à-d. incluant la COIV), en comparant les séries qui excluent les stations situées au large de la COIV (séries A et B) avec celles qui incluent les stations situées au large de la COIV (séries C et D, respectivement).

EMPLACEMENT SPATIAL DES STATIONS

En ce qui concerne le relevé de la CIFP, à partir de 1995-1997, les stations étaient disposées en forme de Y; elles n’étaient pas exactement aux mêmes endroits chaque année, mais étaient assez proches les unes des autres. Depuis 1998, les stations sont positionnées à égale distance les unes des autres sur une grille carrée fixe de 10 milles marins [@flemming2012iphc]. En 1999, le relevé a couvert l’ouest de l’île de Vancouver pour la première fois, mais ne couvrait pas ce secteur en 2000, et couvre ce secteur depuis 2001. Voir @edwards2017redbanded et @yamanaka2018yelloweyeoutside pour les cartes qui montrent les différentes couvertures (et qui montrent les stations où on a capturé du sébaste aux yeux jaunes et du sébaste à bandes rouges, respectivement).

Étant donné la différence de couverture entre les années, pour les séries A et B, nous avons exclu les stations situées au sud du 50,6e$^{\circ}$ de latitude, soit près de l’extrémité nord de l’île de Vancouver. Cette latitude a été choisie de manière à inclure toutes les stations pour la période allant de 1995 à 1997. Durant cette période, les stations affichent un bon chevauchement (au nord de l’île de Vancouver) avec les stations échantillonnées à partir de 1998, même si elles ne se situent pas exactement sur la même grille carrée de 10 milles marins [@yamanaka2018yelloweyeoutside]. Les séries C et D utilisent toutes les stations sur toute la côte (par définition).

Chaque année, quelques stations peuvent être déclarées inutilisables par la CIFP et sont exclues de nos analyses (p. ex., la feuille de pointage sur les hameçons a été emportée par dessus bord pour la station 2 113 en 2008), les codes d’utilisabilité étant décrits au tableaux\ \@ref(tab:iphc-hook-codes) et \@ref(tab:iphc-set-codes). En particulier, nous avons inclus les stations jugées « utilisables, mais omises de toute analyse géospatiale », mais celles-ci devraient être exclues si l’on veut mener des analyses spatiales complexes.

hookCodes =
cbind ("Description" = c ("Inconnu","Hameçon vide",
    "Hameçon appâté",
    "Animal à l’hameçon (poisson ou invertébré)", "Tête d’une espèce sur l’hameçon",
    "Espèce détachée de l’hameçon", "Peau d’appât sur hameçon", "Hameçon non observé",
    "Hameçon avalé ou mordu (par un requin, etc.)"),
    "HOOK_YIELD_CODE" = 0:8)      # from iphc0314.Snw
csasdown::csas_table(hookCodes)

\begin{table}[t] \centering \caption{ Description des classifications d’observation des hameçons et des codes correspondants dans la base de données GFBio.} \label{tab:iphc-hook-codes} \begin{tabular}{lc} \hline Description & HOOK_YIELD_CODE\ \hline Inconnu& 0\ Hameçon vide & 1\ Hameçon appâté & 2\ Animal à l’hameçon (poisson ou invertébré) & 3\ Tête d’espèce sur l’hameçon & 4\ Espèce détachée de l’hameçon & 5\ Peau d’appât sur hameçon & 6\ Hameçon non observé & 7\ Hameçon avalé ou mordu (par un requin, etc.) & 8\ \hline \end{tabular} \end{table}

\begin{table}[tbp] \centering \caption{ Description de la classification des ensembles de la CIFP et indication de ceux que nous incluons dans nos analyses.} \label{tab:iphc-set-codes} \begin{tabular}{lcc} \hline Description & USABILITY_CODE & inclus ici? \ \hline Pleinement utilisable & 1 & Y\ Utilisable, mais ne figure pas dans les calculs de surface balayée & 21 & N\ Utilisable mais spprimé en raison de la redéfinition de la zone & 22 & N\ ~couverte par les relevés & & \ Utilisable, mais ne figure pas dans les calculs de la biomasse & 27 & N\ Utilisable, mais exclu de toute analyse géospatiale & 52 & Y\ \hline \end{tabular} \end{table}

EXPÉRIENCE SUR LES SAUMONS KÉTA APPÂTS {#sec:chum}

Avant 2012, le saumon kéta (\emph{Oncorhynchus keta}) était utilisé comme appât. Mais, en 2012, une expérience à l’aide d’appâts a été menée [@henry2013iphc]. À chaque station, trois types d’appâts différents ont été utilisés sur le même ensemble : un traitement consécutif à quatre patins au saumon kéta, un traitement à un patin au saumon rose (Oncorhynchus gorbuscha) et un traitement à un patin au doré jaune (Gadus chalcogramma). L’emplacement où les trois traitements ont été appliqués sur chaque ensemble a été réparti au hasard tout au long du relevé, et chaque traitement a été séparé par un patin de ligne de fond sans hameçon (1 800 pieds). Par souci de cohérence avec les années précédentes, nous n’avons pris en considération que les quatre patins sur lesquels on a utilisé le saumon kéta comme appât.

Le nombre de patins efficaces fourni par la CIFP concerne tous les patins utilisés, qui, en 2012, ont inclus les patins qui n’ont pas été appâtés avec du saumon kéta (Eric Soderlund, CIFP, Seattle, WA, É.-U., comm. pers.). Mais nous souhaitons n’inclure que les patins appâtés au saumon kéta, et nous devons donc modifier le nombre de patins efficaces (voir ci-après). Le nombre de patins efficaces dépend du nombre d’hameçons observés (Eric Soderlund, CIFP, Seattle, WA, É.-U., comm. pers.), plutôt que du nombre d’hameçons déployés. L’expérience sur les appâts n’a pas été répétée.

ÉQUATIONS DU TAUX DE PRISES {#sec:iphc-equations}

TAUX DE PRISES FONDÉ SUR TOUS LES HAMEÇONS APPÂTÉS AU SAUMON KÉTA

Pour chaque espèce d’intérêt, nous souhaitons obtenir un indice du taux de prises qui, pour chaque année, sera le taux de prises moyen pour tous les ensembles de prises de cette année. Les unités seront le nombre d’individus capturés par patin efficace. Nous ne voulons prendre en considération que les 'hameçons qui sont appâtés au saumon kéta', car nous ne disposons d’aucune information sur la façon dont les taux de prises varient en fonction de l’appât utilisé. En ce qui concerne nos données, 2012 était la seule année où les hameçons n’étaient pas exclusivement des hameçons appâtés au saumon kéta.

Définitions :

$H_{it}$ -- nombre d’hameçons appâtés au saumon kéta observés dans l’ensemble $i$ au cours de l’année $t$,

$H_{it}^$ -- nombre d’hameçons observés pour tous les types d’appâts, ($H_{it} \neq H_{it}^$ seulement pour 2012),

$E_{it}$ – nombre de patins efficaces de l’ensemble $i$ au cours de l’année $t$, qui doit être fondé sur les hameçons appâtés au saumon kéta observés,

$E_{it}’$ – nombre de patins efficaces utilisés par la CIFP, qui est fondé sur tous les hameçons observés (sans égard à l’appât).

Ainsi, $E_{it}$ est \begin{equation} E_{it} = \dfrac{H_{it}}{H_{it}^*} E_{it}’. \end{equation}

En adaptant les équations qui figurent à la page 3 de [@yamanaka2008iphc], on obtient les définitions suivantes :

$N_{it}$ – nombre de poissons d’une espèce donnée capturés au sein de l’ensemble $i=1,2,...,n_t$ au cours de l’année $t$, d’après les hameçons appâtés au saumon kéta observés,

$n_t$ – nombre d’ensembles durant l’année $t$,

$C_{it}$ – taux de prises (avec unités de nombres par patin efficace) pour l’ensemble $i$ au cours de l’année $t$, d’après les hameçons appâtés au saumon kéta observés, donné par \begin{equation} C_{it} = \frac{N_{it}}{E_{it}}. \label{catchPerSet} \end{equation} L’indice du taux de prises pour l’année $t$, $I_t$ (nombre par patin efficace) est alors le taux de prises moyen pour tous les ensembles. \begin{equation} I_{t} = \frac{1}{n_t} \sum_{i=1}^{n_t} C_{it} = \frac{1}{n_t} \sum_{i=1}^{n_t} \frac{N_{it}}{E_{it}}. \label{index} \end{equation}

TAUX DE PRISES FONDÉ SUR LES 20 PREMIERS HAMEÇONS APPÂTÉS AU SAUMON KÉTA DE CHAQUE PATIN

Laissons $\tilde{X}$ indiquer un calcul d’une certaine valeur $X$, qui repose uniquement sur les 20 premiers hameçons de chaque patin. Il s’agit des 20 premiers hameçons numérotés et non des 20 premiers hameçons observés (de sorte que tous les hameçons numérotés n’ont peut-être pas été observés). Ainsi, nous obtenons :

$\tilde{H}_{it}$ -- nombre d’hameçons appâtés au saumon kéta observés parmi les 20 premiers hameçons de tous les patins de l’ensemble $i$ au cours de l’année $t$,

$\tilde{E}_{it}$ – nombre de patins efficaces pour l’ensemble $i$ au cours de l’année $t$, d’après les 20 premiers hameçons appâtés au saumon kéta qui ont été déployés pour chaque patin.

Comme le nombre de patins efficaces est une fonction linéaire du nombre d’hameçons dans un ensemble [@yamanaka2008iphc], nous avons \begin{equation} \tilde{E}{it} = \dfrac{\tilde{H}{it}}{H_{it}} E_{it} \left( = \dfrac{\tilde{H}{it}}{H{it}^*} E_{it}’ \right). \label{effSkateScale} \end{equation}

La notation qui en résulte concernant l’indice sera :

$\tilde{I}_{t}$ – indice du taux de prises pour l’année $t$ (en nombre d’individus par patin efficace) fondé uniquement sur les 20 premiers hameçons déployés pour chaque patin,

$\tilde{N}_{it}$ – nombre d’individus capturés sur l’ensemble $i=1,2,...,n_t$ au cours de l’année $t$, d’après les hameçons appâtés au saumon kéta observés et les 20 premiers hameçons déployés pour chaque patin seulement,

$\tilde{C}{it}$ -- taux de prises (avec unités de nombre par patin efficace) pour l’ensemble $i$ au cours de l’année $t$, fondé uniquement sur les 20 premiers hameçons de chaque patin (et seulement les patins appâtés au saumon kéta), de sorte que \begin{equation} \tilde{C}{it} = \frac{\tilde{N}{it}}{\tilde{E}{it}}. (#eq:catchPerSet20) \end{equation} L’indice du taux de prises par année $t$, $\tilde{I}t$ (en unités de nombres par patin efficace), fondé uniquement sur les 20 premiers hameçons de chaque patin, soit alors le taux de prises moyen pour tous les ensembles : \begin{equation} \tilde{I}_t = \frac{1}{\tilde{n}_t} \sum{i=1}^{\tilde{n}t} \tilde{C}{it} = \frac{1}{\tilde{n}t} \sum{i=1}^{\tilde{n}t} \frac{\tilde{N}{it}}{\tilde{E}_{it}}. \label{index20} \end{equation}

Nous faisons reposer nos calculs sur les moyennes autogénérées, ainsi $I_t$ et $\tilde{I}t$ sont calculés, pour chaque année, en ré-échantillonnant les taux de prises ($C{it}$ ou $\tilde{C}_{it}$) 1 000 fois et en calculant une moyenne autogénérée et un intervalle de confiance à 95\% corrigé et ajusté pour tenir compte des biais.

ÉQUIVALENCE DES TAUX DE PRISES FONDÉS SUR TOUS LES HAMEÇONS ET SUR LES 20 PREMIERS HAMEÇONS SEULEMENT

L’équation \@ref(eq:catchPerSet20) peut s’écrire comme suit \begin{equation} \tilde{C}{it} = \frac{\tilde{N}{it}}{\tilde{E}{it}} = \frac{H{it}}{\tilde{H}{it}} \frac{\tilde{N}{it}}{E_{it}}. \label{tildeCatchPerSet} \end{equation} Si tous les hameçons sont également susceptibles de capturer un individu de l’espèce donnée, alors les taux de prises fondés sur les 20 premiers hameçons de chaque patin devraient être un échantillon non biaisé des taux de prises fondés sur tous les hameçons. Le ratio des individus capturés, $\tilde{N}{it} / N{it}$, devrait être égal (en moyenne) au ratio du nombre d’hameçons, $\tilde{H}{it} / H{it}$, parce qu’un nombre proportionnellement réduit de poissons sont capturés sur des hameçons proportionnellement moins nombreux. Ainsi \begin{equation} \dfrac{\tilde{H}{it}}{H{it}} = \dfrac{\tilde{N}{it}}{N{it}} \end{equation} tel que \begin{equation} \tilde{C}{it} = \dfrac{N{it}}{\tilde{N}{it}} \frac{\tilde{N}{it}}{E_{it}} = \frac{N_{it}}{E_{it}} = C_{it}. \end{equation}

Si les taux de prises sont très différents, cela donne à penser que les taux de prises calculés d’après les 20 premiers hameçons ne sont pas équivalents aux taux de prises calculés d’après tous les hameçons. C’est pourquoi nous comparons la série\ A et la série\ B à la figure \@ref(fig:iphc-ser-plots).

knitr::include_graphics("figure/temp2/notscaled.png", dpi = NA)

CONSTRUCTION DE LA SÉRIE AB

Pour chaque espèce, nous souhaitons joindre les données de 1995 et 1996 de la série B (fondées sur tous les hameçons) aux données de 1997 à 2018 de la série A. Les données de 1995 et 1996 ne sont disponibles que sous forme du nombre d’individus capturés par tous les hameçons, et non du nombre d’individus capturés par les 20 premiers hameçons. Pour la période s’échelonnant entre 1997 et 2002 et pour 2013, nous ne disposons de chiffres que pour les 20 premiers hameçons. Cependant, à partir de 2003-2012 et 2014, nous disposons de données hameçon par hameçon, ce qui nous permet de calculer les taux de prises pour tous les hameçons ou sur la base des 20 premiers hameçons seulement (c’est-à-dire que ces années de chevauchement sont les seules années qui contribuent à la fois aux séries A et B).

Pour la série A, nous définissons $G_A$ comme étant la moyenne géométrique des moyennes annuelles autogénérées, la moyenne géométrique étant fondée uniquement sur les années de chevauchement (à partir de 2003-2012 et 2014). Nous utilisons les mêmes définitions $G_B$ pour la série B. En divisant les valeurs autogénérées de chaque série par leurs moyennes géométriques respectives, nous obtenons la figure \@ref(fig:iphc-ser-plots-2)a. Cela montre que les séries A et B remises à l’échelle sont très similaires pour les années qui se chevauchent. Ainsi, sur cette échelle, les valeurs de 1995 et 1996 de la série B semblent comparables aux données complètes de la série A.

```r est divisée par la moyenne géométrique de ses moyennes annuelles autogénérées (la moyenne géométrique étant fondée sur les années qui se chevauchent seulement). b) L’indice du taux de prises de la série~AB, qui prolonge la série~A originale en incorporant les valeurs de 1995 et 1996 convenablement échelonnées de la série~B (voir le texte).", out.width="3.5in", fig.pos="tbp"} knitr::include_graphics("figure/temp2/rescaled.png", dpi = NA)

\vspace{0mm}

Nous avons vérifié statistiquement la comparabilité en effectuant un test t par paires [@crawley2002] sur les moyennes annuelles mises à l’échelle pour les années qui se chevauchent, afin d’éprouver lhypothèse nulle selon laquelle il ny a pas de différence entre les moyennes annuelles mises à l’échelle, la valeur résultante $p$- étant définie comme $p_{AB}$. Si $p_{AB} \geq 0.05$, alors nous ne pouvons pas rejeter lhypothèse nulle. Ensuite, nous avons joint les deux séries de la figure \@ref(fig:iphc-ser-plots-2)(a) en prenant les valeurs de 1995 et 1996 remises à l’échelle de la série B et en les joignant aux valeurs remises à l’échelle de la série A. De façon équivalente, nous avons simplement multiplié les moyennes et les intervalles de confiance de la série B originale pour 1995 et 1996 par $G_A/G_B$, et nous avons ensuite joint cette série à la série A originale, comme dans la figure \@ref(fig:iphc-ser-plots-2)b, pour obtenir la plus longue série chronologique possible, fondée sur les 20 premiers hameçons pour chaque patin, remis à l’échelle pour 1995 et 1996, deux années pour lesquelles les chiffres concernant les 20 premiers hameçons ne sont pas disponibles.

Si $p_{AB} < 0.05$, alors nous ne pouvons pas joindre la série, nous nous en tenons donc à la série A comme étant la plus longue.

### CONSTRUCTION DE LA SÉRIE D (20 HAMEÇONS, À L’ÉCHELLE DE LA CÔTE) ET COMPARAISON AVEC LA SÉRIE A (20 HAMEÇONS, AU NORD DE L’ÎLE DE VANCOUVER) {#sec:iphc-AD}

Nous considérons maintenant la série D, qui est construite en fonction des 20 premiers hameçons de chaque patin (comme pour la série A), mais qui couvre toute la côte, y compris la COIV (contrairement à la série A), comme le résume le tableau \ref{tab:seriesSumm}.

De la même façon que nous venons de comparer les séries A et B, nous avons divisé chaque série par sa moyenne géométrique ($G_A$ ou $G_D$, sur la base des années qui se chevauchent dans A et D), et nous avons effectué un test t par paires sur les moyennes annuelles autogénérées mises à l’échelle pour les années qui se chevauchent afin dobtenir une valeur $p$- ($p_{AD}$). Là encore, si $p_{AD} \geq 0.05$, on considère les deux séries comme étant comparables.

Pour les séries A et D, cela signifie que nous pouvons considérer que les variations relatives de la série A (qui exclut la COIV) sont les mêmes que celles de la série D (qui comprend toute la côte) et que, par conséquent, nous pouvons considérer que la série A est représentative de lensemble de la côte. La population qui se trouve au large de la côte ouest de l’île de Vancouver ne présente donc pas une tendance relative différente de celle du reste de la côte.

Nous navons pas besoin de joindre les deux séries, nous voulons simplement vérifier si les changements relatifs affichés par la série A peuvent être considérés comme étant représentatifs de lensemble de la côte. Si $p_{AD}<0.05$, tel nest pas le cas.

En ce qui concerne la dernière évaluation du sébaste aux yeux jaunes [@yamanaka2018yelloweyeoutside], les profils relatifs mis à l’échelle pour les séries A et D semblaient similaires pour les années qui se chevauchaient (bien quaucun test statistique nait été effectué). Cependant, les taux de prises *absolus* étaient différents, linclusion des stations de la COIV dans la série D réduisant de façon constante les taux de prises annuels moyens par rapport à ceux de la série A (qui nincluait pas les stations de la COIV), avec $G_A/G_D=1.12$ pour les années qui se chevauchent (ils seraient égaux à 1 si les taux de prises étaient les mêmes). Les stations qui se trouvent au large de la côte ouest de l’île de Vancouver ont enregistré des taux de prises moyens de sébaste aux yeux jaunes inférieurs à ceux des autres stations.

Ainsi, bien que linclusion des stations de la COIV ne semble pas modifier le profil*« relatif* de lindice de la population, elle modifie les valeurs absolues. En conséquence, les stations qui se trouvent au large de la COIV doivent être incluses ou exclues de façon constante si nous voulons construire une série dindices; comme nous avons plus dannées sans stations au large de la COIV (tableau \@ref(tab:seriesSumm)), nous excluons systématiquement ces stations (ce qui donne la série A).

### CONSTRUCTION DE LA SÉRIE C (TOUS LES HAMEÇONS, À L’ÉCHELLE DE LA CÔTE) ET COMPARAISON AVEC LA SÉRIE B (TOUS LES HAMEÇONS, AU NORD DE L’ÎLE DE VANCOUVER) {#sec:iphc-BC}

De la même manière, nous avons également construit la série C, qui concerne tous les hameçons de chaque patin (comme pour la série B) mais qui couvre toute la côte, y compris la COIV (contrairement à la série B), comme le résume le tableau \ref{tab:seriesSumm}.

Nous avons à nouveau comparé chaque série mise à l’échelle par sa moyenne géométrique des années qui se chevauchent et nous avons effectué un test t par paires sur les moyennes annuelles autogénérées mises à l’échelle pour les années qui se chevauchent, en donnant une $p$- valeur de $p_{BC}$. Là encore, si $p_{BC}\geq 0.05$, on considère les deux séries comme étant comparables. Cela signifie que nous pouvons considérer les changements relatifs affichés par la série B pour refléter ceux qui sont afférents à lensemble de la côte (série C).

En ce qui concerne la dernière évaluation du sébaste aux yeux jaunes [@yamanaka2018yelloweyeoutside], tout comme pour les séries A et D dont il vient d’être question, les profils relatifs mis à l’échelle pour les séries B et C semblaient similaires pour les années qui se chevauchent. Cependant, les taux de prises *absolus* étaient différents, linclusion des stations de la COIV dans la série C réduisant de façon constante les taux de prises annuels moyens par rapport à ceux de la série B (qui nincluait pas les stations de la COIV), avec $G_B/G_C=1.11$ pour les années qui se chevauchent.

Ainsi, les stations qui se trouvent au large de la côte ouest de l’île de Vancouver ont enregistré des taux de prises moyens de sébastes aux yeux jaunes inférieurs à ceux des autres stations. Cela est vrai pour tous les hameçons (ici) ou pour les 20 premiers hameçons seulement lorsquon compare les séries A et D (ci-devant).

### INDICE LE PLUS LONG RÉSULTANT DU RELEVÉ DE LA CIFP

Donc, si $p_{AB} \geq 0.05$, alors la série AB peut être créée, et il sagit de lindice dérivé du relevé de la CIFP le plus long quon puisse construire. Si $p_{AD} \geq 0.05$ et $p_{BC} \geq 0.05$, alors les séries A et B peuvent être considérées comme étant représentatives de lensemble de la côte, de même que la série AB.

Si $p_{AB} \geq 0.05$, mais que
$p_{AD} < 0.05$  ou
$p_{BC} < 0.05$,
alors la série AB est toujours la plus longue série chronologique possible, mais ne peut être considérée que comme représentant les eaux au nord de l’île de Vancouver, et non lensemble de la côte. Si $p_{AB} < 0.05$, alors la série\ A est la série chronologique la plus longue.

Dans certains cas particuliers despèces qui sont rarement capturées (ou qui nont pas été précisément dénombrées en 1995 et 1996, par exemple), la série A peut être la plus longue, voire la série C ou la série D si lespèce na pas été capturée certaines années. Il se peut que certains rares cas spéciaux ne soient pas encore entièrement pris en considération dans notre code et doivent être vérifiés espèce par espèce, en particulier si lon veut déterminer si une espèce donnée a été activement identifiée au cours dune année donnée (ce qui donne un taux de prises nul plutôt que 'Aucune donnée '). En outre, une série chronologique plus courte et pour tous les hameçons (série\ B ou série\ C) peut être plus instructive quune série chronologique plus longue fondée uniquement sur les 20\ premiers hameçons. Toutes les séries sont calculées pour toutes les espèces et doivent faire lobjet dun examen plus approfondi pour quon puisse faire des inférences subséquentes.

En outre, bien que certaines espèces soient rarement capturées dans le cadre du relevé de la CIFP, nous avons montré toutes les données disponibles (plutôt que de fixer une exigence minimale selon laquelle un certain nombre dindividus doivent être capturés au cours dune année ou au cours dune série chronologique complète). Cela crée parfois d’étranges modèles en dents de scie lorsquune espèce est capturée certaines années seulement (p. ex. le sébaste à bandes vertes dans la section \@ref(sec:greenstriped-rockfish)). Cependant, cela est inévitable étant donné notre objectif qui consiste à montrer toutes les données disponibles, et démontre en outre la nécessité dexaminer les données si lon veut acquérir une compréhension approfondie concernant une espèce particulière.

## CONCURRENCE À L’ÉGARD DES HAMEÇONS

La démarche ci-devant a été utilisée par @yamanaka2018yelloweyeoutside pour
montrer comment construire un indice pour le sébaste aux yeux jaunes qui soit
représentatif de lensemble de la côte et qui remonte à 1995. Une autre démarche
a été utilisée pour générer un indice pour le modèle d’évaluation (Marie Etienne
et al. *Extracting abundance indices from palgline surveys: a method to account
for hook competition and unbaited hooks*, [manuscrit non publié](https://arxiv.org/abs/1005.0892)). Ces auteurs ont tenté de rendre compte de leffet de la concurrence entre les poissons qui se disputent les appâts qui se trouvent sur les hameçons.

Si certains des hameçons dun ensemble ont capturé des poissons individuels, alors ces hameçons ne sont plus utilisés pour la pêche. Lintégration dune telle « concurrence à l’égard des hameçons appâtés » implique une augmentation des taux de prises si lon veut tenir compte du fait que tous les hameçons observés n’étaient pas disponibles pour la pêche pendant la durée de la période dimmersion.

@clark2008iphc et @webster2011iphc ont étudié cette question dans le cadre du relevé de la CIFP, afin daider à estimer les indices du flétan du Pacifique, et nous en dérivons ici un modèle de la concurrence à l’égard des hameçons appâtés daprès leur travail (et nos observations antérieures). Cela na pas encore été incorporé dans nos analyses, mais pourrait l’être à lavenir, bien quil faille pour cela décider quoi faire dans les cas où aucun des hameçons nest récupéré avec son appât (voir ci-après), ce qui n’était pas possible pour le présent rapport.

À la suite de nos observations antérieures, il convient de définir :

$N_{its}^{(0)}$   le nombre de poissons appartenant à une espèce $s$ que lon sattendrait à capturer *en labsence dune compétition à l’égard des hameçons appâtés* dans lensemble $i=1,2,...,n_t$ au cours de lannée $t$, daprès les hameçons appâtés au saumon kéta observés,

$F_{its}$   le taux local de capture dappâts par espèce $s$ autour de lensemble $i$ durant lannée $t$.

Le nombre $N_{its}^{(0)}$ est proportionnel à la densité locale réelle de cette espèce, ainsi, nous souhaitons lutiliser comme un indice de labondance. Et, par définition,
\begin{equation}
N_{its}^{(0)} = F_{its} H_{it},
\label{eq:Nits0}
\end{equation}
où, comme précédemment, $H_{it}$ est le nombre dhameçons appâtés au saumon kéta dans lensemble $i$ pour lannée $t$.
@clark2008iphc a fait remarquer que, "Mathématiquement, le processus de retrait des appâts d’une palangre par différentes espèces est le même que le processus de retrait des poissons d’une population par différentes pêcheries et prédateurs naturels". Chaque espèce élimine une certaine proportion des appâts par unité de temps, de sorte quon peut utiliser l’équation de prise de Baranov pour obtenir
\begin{equation}
N_{its} = F_{its} H_{it} \frac{\left(1 - \mathrm{e}^{- Z_{it}} \right)}{Z_{it}},
\label{eq:Nits}
\end{equation}
où $Z_{it}$ est la somme des taux de prises instantanés par toutes les espèces, cest-à-dire
\begin{equation}
Z_{it} = \sum_s F_{its},
\label{eq:Zit}
\end{equation}
et le temps dimmersion peut être omis, car il ny a pas de différence importante entre le temps dimmersion plus court et le temps dimmersion plus long [@webster2011iphc]; les ensembles sont immergés pendant au moins cinq heures.


En substituant $F_{its} H_{it}$ de \@ref(eq:Nits0) dans \@ref(eq:Nits), on obtient
\begin{equation}
N_{its} = \frac{N_{its}^{(0)} \left(1 - \mathrm{e}^{- Z_{it}} \right)}{Z_{it}},
\end{equation}
qui, après réarrangement, donne
\begin{equation}
N_{its}^{(0)} = \frac{Z_{it}}{1 - \mathrm{e}^{- Z_{it}}} N_{its}.
\label{eq:Nits0rearrange}
\end{equation}

On définit $P_{it}$ comme étant la proportion dhameçons appâtés au saumon kéta observés (pour lensemble $i$ au cours de lannée $t$) qui sont récupérés avec leur appât (et quon présume donc être en condition de pêche continue). Les autres appâts sont capturés par un poisson ou perdus (soit échappés de lhameçon, soit pris par un poisson qui na pas été capturé par la suite). Si lon considère les appâts perdus (hameçons vides) comme une autre « espèce » la proportion dhameçons récupérés avec appâts est, par définition,
\begin{equation}
P_{it} = 1 - \frac{\sum_s N_{its}}{H_{it}},
\end{equation}
de sorte que (après réarrangement),
\begin{equation}
\sum_s N_{its} = {H_{it}} \left(1 -  P_{it} \right).
\label{eq:sumsNits}
\end{equation}


Maintenant, en additionnant \@ref(eq:Nits) sur toutes les espèces $s$, on obtient
\begin{equation}
\sum_s N_{its} = \sum_s F_{its} H_{it} \frac{\left(1 - \mathrm{e}^{- Z_{it}} \right)}{Z_{it}}.
\end{equation}
En substituant à partir de \@ref(eq:sumsNits) et de \@ref(eq:Zit), on obtient
\begin{align}
{{H_{it}}} \left(1 -  P_{it} \right) & = Z_{it} H_{it}
  \frac{\left(1 - \mathrm{e}^{- Z_{it}} \right)}{Z_{it}} \\
1 -  P_{it} & =
  1 - \mathrm{e}^{- Z_{it}}
  \label{eq:oneminP} \\
Z_{it} & = - \ln P_{it}.
  \label{eq:zitP}
\end{align}

En substituant \@ref(eq:oneminP) et \@ref(eq:zitP) en \@ref(eq:Nits0rearrange), on obtient
\begin{align}
N_{its}^{(0)} & = \frac{-\ln P_{it}}{1 - P_{it}} N_{its} \\
              & = A_{it} N_{its},
\label{eq:Nits0rearrange2}
\end{align}
où
\begin{equation}
A_{it} = \frac{-\ln P_{it}}{1 - P_{it}}
\end{equation}
est le facteur dajustement de la concurrence pour chaque ensemble et chaque année et est montré à la figure \@ref(fig:iphc-hook-comp-adjustment).


```r$ varie selon la proportion d’hameçons qui sont récupérés avec leur appât, la proportion la plus faible étant fixée à 1/800..", fig.pos="tb"}
Pit <- c( seq(1/800, 0.1, length=200), seq(0.1, 0.99, 0.01) )
hook_adjust = - log(Pit) / (1 - Pit)
plot(Pit, hook_adjust, ylim=c(0, max(hook_adjust)), type="l",
     xlab = expression("Proportion d’hameçons avec appât, P"[it]),
     ylab = "Facteur d’ajustement de la concurrence à l’égard des hameçons appâtés")
````

Cela augmente le nombre observé de spécimens de chaque espèce capturé, $N_{its}$, pour donner le nombre attendu de spécimens capturés en tenant compte de la concurrence à l’égard des hameçons appâtés, $N_{its}^{(0)}$, selon la proportion $P_{it}$ d’hameçons observés qui sont récupérés avec leur appât.

\vspace{0mm}

Il est à noter que, par définition, $0 \leq P_{it} \leq 1$, and so $\ln P_{it} \leq 0$.
$P_{it} \rightarrow 1$ then by L'H\mbox{\^o}pital's Rule
\begin{align}
\lim_{P_{it} \rightarrow 1} A_{it} & = \lim_{P_{it} \rightarrow 1} \frac{-\ln P_{it}}{1 - P_{it}}\\
 & = \dfrac{\lim_{P_{it} \rightarrow 1} (-1 / P_{it})}{\lim_{P_{it} \rightarrow 1} (-1)}\\
  & = 1,
\end{align}
en tant que $N_{its}^{(0)} = N_{its}$, qui est égal à $0$ (si tous les hameçons sont récupérés avec leur appât, alors $N_{its} = 0$ pour toutes les espèces $s$).

\vspace{0mm}

Cependant, en tant que tel $P_{it} \rightarrow 0$, $A_{it} \rightarrow \infty$, le nombre prévu $N_{its}^{(0)} \rightarrow \infty$. Dans la pratique, cela arrive assez souvent. Il existe des ensembles `r nrow(bait_set_counts)` dans les données. Parmi les `r nrow(filter(bait_set_counts,! is.na(N_it)))`, pour lesquels tous les hameçons de chaque patin ont été utilisés pour le dénombrement, `r nrow(filter(bait_set_counts, N_it == 0))` avait $P_{it} = 0$.. Si l’on considère les ensembles `r nrow(filter(bait_set_counts,! is.na(N_it20)))` pour lesquels nous pouvons calculer les taux de prises en fonction des 20\ premiers hameçons de chaque patin (c.-à-d.\ toutes les années sauf 1995 et 1996), `r nrow(filter(bait_set_counts, N_it20 == 0))` affichait $P_{it}=0$ pour les 20\ premiers hameçons.

Ainsi, le choix de ce qu’il convient d’utiliser pour $A_{it}$ et à quel moment $P_{it} = 0$ est important, car il permettra souvent d’augmenter les taux de prises observés à l’aide de l’équation \@ref(eq:Nits0rearrange2). Une option consisterait à fixer le taux de prises à la valeur obtenue si un seul hameçon avec appât est récupéré pour un ensemble. Pour un ensemble comportant 800 hameçons observés (essentiellement le maximum), la plus petite valeur positive possible est $P_{it} = 1/800$, qui donne $A_{it} = 6.69$ (Figure \@ref(fig:iphc-hook-comp-adjustment)).

Les chiffres \@ref(fig:iphc-hook-with-bait) et \@ref(fig:iphc-hook-with-bait-twenty) montrent comment le nombre d’hameçons récupérés avec leur appât dans chaque ensemble varie d’une année à l’autre (bien que cela soit dû en partie au nombre variable d’hameçons récupérés). Ils montrent que l’incidence de la concurrence à l’égard des hameçons appâtés peut varier d’une année à l’autre et que, par conséquent, si l’on veut tenir compte de cette concurrence, il faut le faire avec beaucoup de prudence.

```r
ggplot(data=bait_set_counts,
       aes(N_it) ) +
    xlab("Nombre d’hameçons récupérés avec leur appât dans chaque ensemble") +
    ylab("Fréquence (nombre d’ensembles)") +
    geom_histogram() +
    facet_wrap(. ~ year, ncol=4)
ggplot(data=bait_set_counts,
       aes(N_it20)) +
    xlab("Nombre d’hameçons récupérés avec leur appât dans chaque ensemble") +
    ylab("Fréquence (nombre d’ensembles)") +
    geom_histogram() +
    facet_wrap(. ~ year, ncol=4)
# be good to have the 20 hook ones in different colour, or just do all N_it20 except for 1995 and 1996


pbs-assess/gfsynopsis documentation built on March 26, 2024, 7:30 p.m.